JP5208104B2 - 第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法 - Google Patents

第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法 Download PDF

Info

Publication number
JP5208104B2
JP5208104B2 JP2009508650A JP2009508650A JP5208104B2 JP 5208104 B2 JP5208104 B2 JP 5208104B2 JP 2009508650 A JP2009508650 A JP 2009508650A JP 2009508650 A JP2009508650 A JP 2009508650A JP 5208104 B2 JP5208104 B2 JP 5208104B2
Authority
JP
Japan
Prior art keywords
software version
data
version
data model
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009508650A
Other languages
English (en)
Other versions
JP2009537037A (ja
Inventor
ウンフリート,ヨハネス
Original Assignee
ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー filed Critical ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー
Publication of JP2009537037A publication Critical patent/JP2009537037A/ja
Application granted granted Critical
Publication of JP5208104B2 publication Critical patent/JP5208104B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates
    • G06F8/656Updates while running
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、連続的に適応化する少なくとも一つの第1のデータモデルを使用するデータプロセッサ上の第1の適応化データ処理バージョンから、連続的に適応化する少なくとも一つの第2のデータモデルを使用している第2の適応化データ処理バージョンに、データ処理結果に基づいて、切り替えるためのシステムと方法に関する。さらにまた、本発明は、コンピュータプログラムプロダクトに関する。そして、それは、第1の適応化データ処理バージョンから第2のものへの切り替えにかかる方法を実行するために用いてもよい。
特にワードプロセッサの分野で、古い(第1の)処理ソフトウェアバージョンから新しいもの(第2のもの)に切り替えるときに、後方互換性(旧バージョン互換性)および前方互換性(新バージョン互換性)を維持することは、当該技術の課題である。これに関連して、潜在的に部分的互換性がない異なるソフトウェアバージョンを使用するときに、データファイルの完全性を保存するための特定の認識ビットを使用することは公知である。例えば、特許文献1を参照。
また、特定のファイルが、以前のバージョンのアプリケーションプログラムに基づくか新しいものに基づくかどうかを示すことが可能な「電子透かし(water mark)」をデータファイルに含めることは公知である。例えば、特許文献2参照。
米国特許5983242号明細書 米国特許6704432号明細書
しかしながら、これらの周知の技術は、例えばパーソナルコンピュータのような計算手段のシステムに、異なるバージョンのアプリケーションソフトウェアがある場合、全く同一のデータをどのように処理するかの課題に直面する。
例えば、特定の適応化データモデルが用いられる場合、多数のデータ量を処理するためにプログラムを走らせる場合、そしてデータモデルが連続的に「トレーニングされる」場合では、古いプログラムバージョンの代わりに新しいものを使用する際の課題は、さらに深刻である。すなわち、修正後の認識結果を基に適応化してゆくもの、例えば、自動音声認識および音声ファイルのテキストファイルへの変換の分野のケースが挙げられる。音声認識入力データを基に音声データをテキストファイルに変換するときに、ある種類のこれらの音声データがユーザに依存するという事実から、特定の適応化データモデルを使用することが知られている。特に、それぞれのユーザのための音声参照データモデルを含んでいる音声特性を使用することが、通常行われている。さらに、言語データモデルが用いられてもよい。例えば語の移行が特定の確率で特定のユーザに依存していることを考慮する。なぜなら、ある著者は、特定の語Xに続いて特定の語Yを使用することがしばしばあるからである。それから、データモデルは、それらが特定のユーザにより発音される情報を含んでいる認識可能な語を有する辞書に基づいてもよい。そして、文法データモデルを使用することも可能である。数に関する文法、日付に関する文法等に関するデータが含まれる。
データ処理の間、すなわち自動音声認識およびテキストファイルに対するスピーチデータの自動変換の間、これらのデータの一部は、フィードバックループで連続的に適応化されてゆく。これによって、この連続適応化またはトレーニングによる認識精度の本質的な上昇がなされる。例えば、処理結果に基づいたフィードバックによって、新しい語が、辞書データモデルに加えられてもよい。ユーザの話し方をよりよく表すように、言語データモデルがアップデートされてもよい。新しい文法による表現によって、文法もまたアップデートされる。そして、音響参照データモデルの音声が、ユーザ特定の調音によりよく似るようにアップデートされる。のこの種のデータモデルに関するすべての適応化処理は、フィードバック処理によって可能になる。その際、自動的に変換されたファイルは、その後に音声ファイルを聞き、対応する変換されたテキストファイルを読むことによって修正される。
同様の状況は、データ処理結果を基にして、フィードバックループでその連続的な適応化を行うデータモデルの使用に基づいて、膨大なデータ量が処理されるような他のデータ処理システムにも当てはまる。このシステムでは、ニューモデルの事前トレーニングのための存在を許容しない場合、または、ニューモデルの存在は許容するが事前のトレーニングを許容しない場合である。例えば、アルゴリズムに依存する画像データモデルを基にデータ処理を備えるシステム、地図等を作成する場合の衛星画像伝送、または遺伝子解析の分野のシステム、または関連したサウンドデータの分野のシステム、その他、そして、適応化データモデルを基にして表現される大量のデータがある他のいかなる分野の技術もこれに該当する。
かかる適応化データモデルシステムにおいて、しばしば、使用されるアルゴリズムに関して改良され、効果がある新しいデータ処理ソフトウェアバージョンが開発される。例えば、より高いパフォーマンスを持つ音声認識が開発される。しかしながら、これらのアルゴリズム変更は、通常基礎をなすデータモデルの変更を意味し、または全く新しい最初のデータモデルでさえあることもある。原則として、データモデルは、新しいソフトウェアバージョンの利用に適している新しいデータモデルに単純に変換できることは、むしろほとんどのケースにおいてまれである。すなわち、多くの場合、データモデルは、全く変換できない。データの修正にあまりの負担がかかるため、データモデルを事前に適応化させることは、現実的でない。すなわち、データモデルが理論的には事前の適応化を実施しやすい場合であっても、かかる事前の適応化はしばしば時間の浪費となり、複雑なアップグレード手順を必要とする。特に、自動音声認識およびテキストファイルへの自動変換の中で、一般にデータモデルは大量の音声材料によって最適化される。そして、新しい音声認識ソフトウェアバージョンがインプリメントされたとき、移植目的のために、その音声材料を保つことは、通常は可能でない。したがって、新しい音声認識バージョン(または一般に、新しいデータ処理バージョン)をインプリメントする場合、以前の連続的に適応化するデータモデルが維持できない場合には、前に得られた情報、すなわち以前のデータ処理の間適応化されていたデータモデルは失われることになる。なぜなら、新しい(第2の)データ処理ソフトウェアバージョンと関連して、最初のデータモデルから開始しなければならないからである。このことは、このシステムのユーザが古い(第1の)ソフトウェアバージョンを更に使用するのを好むことを意味する。なぜなら、連続的に適応化するデータモデルを基に、すでに全く良好な認識パフォーマンスが達成されているからである。今新しいソフトウェアバージョンに切り替えることによって、連続的に適応化する古いデータモデルはもはや利用できないため、この品質が切り替え時期の間失われる。そして、新しいソフトウェアバージョンの改良されたアルゴリズムが使用されるときに、新しい初めてのデータモデルが適応化されなければならない。少なくとも十分なパフォーマンスが発揮されるようになるまで、充分なデータによって新しいデータモデルがトレーニングされなければならない。このため、多くのユーザは、適応化するデータモデルを有する古いソフトウェアバージョンを支持する傾向がある。顧客が認識パフォーマンスの劣化を予想するため、ロールアウトおよび新しいソフトウェアのバージョンの使用は妨げられることになる。そして、(より長い時間を考慮すると、この新しいバージョンが有する改良型アルゴリズムが、より良好な音声認識精度等を発揮することが可能であるにもかかわらず)ユーザは新しいソフトウェアバージョンへの切換えを拒否する。
データモデルが主に新しいソフトウェアバージョンにより適応化される場合、留意する点としては、例えば、音声認識システムでは、しばしば15,000人のユーザが接続されるということである。そして、各ユーザはそれ自身のデータモデルを有するのである。データモデルを新しいソフトウェアバージョンに適しているようにするため、たとえば1ユーザにつき20MBまで、適応化のめに手当てすると、適応化データの総量は、ほぼ300GBとなることを意味する。そして、対応する300GBのディスクスペースが必要となる。
したがって、以前のデータモデルに戻れる必要性と、逆に、新しいソフトウェアバージョンに切り替え、改良されたアルゴリズムの有利さを得る立場が存在し、データ処理結果の品質を悪化させることなく古いデータ処理バージョンから新しいものに切換えるための解決策が長い間望まれていた。
したがって、本発明の目的は、古い第1の適応化データ処理バージョンから新しい第2の適応化データ処理バージョンに切り替える方法および装置を提供することである。同時に、第1の適応化データ処理バージョンによって、すでに得られている良質な結果を、少なくとも実質的に失うことなく第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えることを目的とする。
さらに発明の目的は、データプロセッサにロードされるときに、パフォーマンスの損失なしに第1のソフトウェアバージョンから第2のものに切り替えて、本発明の方法を実行するコンピュータプログラムを含むコンピュータプログラムプロダクトを提供することである。
本願発明の第1の態様における方法は、データ処理結果を基に連続的に適応化される少なくとも一つの第1のデータモデルを使用する、データプロセッサ手段上の、第1の適応化データ処理バージョンから、連続的に適応化される少なくとも一つの第2のデータモデルを同様に使用する、第2の適応化データ処理バージョンに切り替える方法であって、第1段階において、前記第2の適応化データ処理バージョンが、前記第1の適応化データ処理バージョンと平行して使われ、前記第1の適応化データ処理バージョンに関連した前記少なくとも一つの第1のデータモデルと、前記第2の適応化データ処理バージョンに関連した前記少なくとも一つの第2のデータモデルとを連続的に適応化させ、かつ前記第2の適応化データ処理バージョンのデータ処理のパフォーマンスが品質基準に適合するかがチェックされ、その後、第二の段階において、前記品質基準が満たされ次第、前記第2の適応化データ処理バージョンによる前記データ処理結果が使われるために出力されることを特徴とする方法である。
本願発明の第2の態様におけるシステムは、データ処理結果を基に連続的に適応化される少なくとも一つの第1のデータモデルを使用するデータ処理のための第1の適応化データ処理バージョンを有するデータプロセッサを有するシステムであって、前記データプロセッサは、前記第1の適応化データ処理バージョンと平行して第2の適応化データ処理バージョンを走らせるように調整され、かつデータ処理結果を基に連続的に適応化される少なくとも一つの第2のデータモデルを使用し、かつ前記データプロセッサが、ぞれぞれの少なくとも一つのデータモデルの前記連続適応化によって、前記第2のデータ処理結果の十分な品質が達成されたときに、前記第1の適応化データ処理バージョンの前記データ処理結果から前記第2の適応化データ処理バージョンの結果の出力に切換えるよう調整されることを特徴とするシステムである。
本願発明の他の態様は、本願発明の切り替え方法を実行するコンピュータプログラムを記録したコンピュータプログラム製品である。特に、コンピュータプログラムが前記第2の適応化データ処理バージョンを実行するソフトウェアを含むコンピュータプログラムをも記録したコンピュータプログラム製品である。
本発明は、新しいもの(すなわち第2の適応化データ処理バージョン)をバックグラウンド(すなわちシャドー)で、新しいデータモデルすなわち新しいバージョンと関連したデータモデルを同時にバックグラウンドで適応化させる考えに基づく。この適応化するデータモデルが、最初のデータ処理バージョンと関連した前データモデル(「レガシー」モデル)と同等またはよりよくパフォーマンスを提供するまで続ける。第2の適応化データ処理バージョンが同等かより良い結果を出すまでは、前データモデルに基づく、第1の適応化データ処理バージョンによって得られる結果がユーザに提供される。第1の適応化データ処理バージョンおよび第1のデータモデルから第2の適応化データ処理バージョンおよび第2のデータモデルに全く自動的に切り替えてもよい。このために、第2の適応化データ処理バージョンに関連したデータモデルにトレーニングされる所与のデータ量が予め定められた基準として使われると定められてもよい。適応化するデータの量が所与のデータ量と比較される。前記所与のデータ量に到達したときに、第2の適応化データ処理バージョンによるデータ処理結果の使用に自動的に切り替わる。この方法は、非常に便利であり、コンピュータ時間を節約する解決策である。なお、直接のパフォーマンス比較を基に2つのバージョンを切換えることも可能である。パフォーマンスに関し、第2の適応化データ処理バージョンによるデータ処理結果が第1の適応化データ処理バージョンによるデータ処理結果と自動的に比較されることは、効果的である。第2の適応化データ処理バージョンの結果が第1の適応化データ処理バージョンの結果と等しいかより優れるようになったとき、第2の適応化データ処理バージョンの結果の使用に自動的に切り替えられる。
一方では、第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに強制的に切り替えを行うことも可能である。第2の適応化データ処理バージョンのパフォーマンスが第1の適応化データ処理バージョンの結果に関して推定される場合、それは役立つだろう。そして、十分なパフォーマンスの場合には、第2の適応化データ処理バージョンの結果の使用に対する切替えは強制される。
このように、本発明のシステムの好ましい実施例は、第2の適応化データ処理バージョンに関連したデータモデルにトレーニングされる所与のデータ量が、予め定められた品質基準として使われるという点を特徴とする。これは、適応化するデータの量を所与のデータ量と比較し、所与のデータ量に到達したときに第2の適応化データ処理バージョンによるデータ処理結果の使用に自動的に切り替えるための手段である。または、第2の適応化データ処理バージョンによるデータ処理手段の結果と第1の適応化データ処理バージョンによるデータ処理手段の結果を比較するための手段および第2の適応化データ処理バージョンの結果が第1の適応化データ処理バージョンの結果より優れているときに、自動的に第2の適応化データ処理バージョンの結果に切り替える手段である。
本発明は、自動音声認識およびスピーチデータから修正され得るテキストファイルへの自動の変換に有用である。これに関係して、特定の音響参照データモデル、例えばそれぞれのユーザの音声データモデルおよび言語データモデルを連続的に適応化させるのに有利である。なお、連続的に適応化を行うことは、言語データモデル、文法および辞書データモデルに同様に適用されてもよい。これらのモデルはそれ自体周知である。都合のよいことに、すでに上述したように、本発明は、多数のデータ量がデータモデルを使用して処理され、これがデータ処理結果を基にフィードバックによって連続的に適応化されるような、他のデータ処理のために使われてもよい。
本願発明の、上述した態様および他の態様、目的、特徴および有利な点は、関連する図面を参照しながら、好ましい実施例を記載した以下の詳細な説明から明らかとなるであろう。
図面を参照して本発明を以下に詳述する。図面の参照番号を示しながら、本発明の好ましい実施例が示される。
図1に、データ処理システム1を示す。更に詳細に、かかるシステムの実施例として、記録されたサウンドデータを自動的に認識し、音声ファイルをテキストファイルへ変換し、その後テキストファイルは音声ファイルを基に手動で修正されるシステム1を示す。このシステム1には、すなわち、各々例えば音声データを記録再生するオーディオ装置(図示しないマイクロホン、スピーカ)を有するパーソナル・コンピュータ(PC)からなる複数の記録ステーション2.1...2.iが含まれる。記録ステーションは、2から始まる番号によって参照される。音声データは、記録の後、音声ファイル(スピーチファイル)としてネットワーク3(たとえばローカルエリアネットワーク/ワイドエリアネットワーク(LAN/WAN))に出力される。更に、このネットワーク3は、認識適応化ステーション4(より詳細に4.1...4.k)に接続し、ここで記録ステーション2により出力された音声ファイルは、データベース5に格納され、当該技術において周知のように自動的に認識されてテキストファイルに変換される。これらの認識/適応化ステーション4は、PCを有していてもよい。データベースまたはファイルサーバ5は音声ファイル、さらに認識されたテキストファイルおよび修正されたテキストファイルを含む。自動的に得られたテキストファイルの修正に関しては、複数の修正ステーション6(例えばPCを含む)が設けられていて、ネットワーク3に接続されている。よりこれらの修正ステーション6(詳細には、6.1...6.k)を用いて、自動的に得られデータベース5に格納されたテキストファイルが手動で修正される。手動での修正は、音声ファイルを聞いている者が修正作業をするときになされる。提供された修正は、更なるデータベース7に格納されたデータモデルへのフィードバックとして使われる。データベース7は、データベース・メタ情報を含み、特に、それぞれのユーザに特有のデータモデルを含む。より具体的には、このデータモデルには、ユーザに特有の音声を参照するデータを含む音響参照モデル、ユーザに特有でそれぞれのユーザの語移行の確率を指す言語データモデル、さらに、文法データモデル、それぞれのユーザによってどのように発音されるかの情報を有する認識可能な語を含む辞書データモデルが含まれる。すべてのこれらのデータモデルは、データベース7に格納される。以下の説明において、かかるデータモデルが参照される。「少なくとも1つの」または、「一つの」データモデルを指す場合でも、実際には、多くのモデル、すなわち多数のユーザに対して各々いくつかのモデルが存在していることは明らかである。
記載されている音声認識システム1に関する限り、この技術はよく知られている。
自動音声認識および変換のために、認識適応化ステーション4は、(第1の)ソフトウェアバージョン(V1)(図2参照)を使用する。このソフトウェアバージョン(V1)は、データベース7に格納されている特定のV1アルゴリズムおよび関係しているV1データモデルを利用する。すでに上述したように、修正テキストファイルのフィードバックを基に、これらのV1データモデル(dmi)はテキストファイルの自動音声認識、変換および修正の間、連続的に適応化する。このフィードバックは言語モデルを参照する。フィードバックによって、改善する方向にそれぞれのユーザの話し方を反映させる。そして、ユーザの調音をよりよく表す音響参照データモデルの音声、文法データモデルをアップデートするための新しい文法表現、辞書データモデルに加えられる新語がアップデートされる。データモデルのこの連続的な適応化によって、認識精度が改善される。
しかしながら、自動音声認識および変換を実行するために、使用されるアルゴリズムに関して改良された新しいデータ処理バージョンのソフトウェア(図2に示すV2)が、しばしば導入される。例えば新しいパラメータまたは変数が導入されたアルゴリズムの変更のため、新しい基礎をなすデータモデル(Dmi)が用いられることになる。そして、ほとんどの場合、前バージョンV1によって使用される古いデータモデルdmiを第2の新しいバージョンV2により使用される新しいデータモデルDMiに変換することは可能でない。かかる変換、またはV1モデルと関連して過去に集められたデータに基づく事前の適応化が可能であっても、この変換または事前の適応化は、むしろ時間がかかり、記憶装置を消耗し、かつ非常に複雑である。特に、15,000人のユーザ(15,000台の記録ステーション2に対応する)がシステム1に接続されてもよいことを留意すべきである。したがって、V2に関連したデータモデルによってV2バージョンに基づいた認識パフォーマンスは、よりよい認識精度を達成することができるにもかかわらず、ユーザは、古いソフトウェアバージョンV1に固執する傾向がある。なぜなら、過去の連続したデータモデルの適応化によって、その時点において、音声認識パフォーマンスは、トレーニングデータのないデータモデルである初期のデータモデルを基にソフトウェアバージョンV2のそれより良好だからである。新しい(第2の)V2ソフトウェアバージョンがV1アルゴリズムを含み、V1アルゴリズムを適用することによって、V1データモデルを使用できる場合も、状況は同じである。なぜなら、その時点で、改良されたV2アルゴリズムを有する新しいソフトウェアバージョンV2による利点を享受できないからである。したがって、事実、今までは、新しいV2システムバージョンへの切替えにより、初期のV2データモデルを基にしたV2システムのパフォーマンスという初期の不利な点を受け入れることを選択する以外なかった。
図2は、V1データモデルdm1...dmi...dmn(i=1...n)に基づいて、第1の処理バージョンV1において、音声認識および変換がどのように実行されるかを図式的に示したものである。ここで、フィードバックループ8は認識パフォーマンスを高めるために、連続的にデータモデルdmiを適応化する。変換結果(テキストファイル)は、9から出力される。そして、本発明では、第2の新しいソフトウェアバージョンV2が、対応する(第1の)データモデルDM1...DMi...DMnとともに、第1の適応化データ処理バージョンV1と併存して、インプリメントされる。フィードバックループ8‘を用いて、V1処理と平行して前記V2バージョンを有する音声認識変換を実行するときに、これらのV2データモデルDMiもまた連続的に適応化される。しかしながら、この音声認識変換の結果はデータモデルDMiが十分に適応化された時期以降に9‘から出力される。これによる出力は、第1の適応化データ処理バージョンV1を用いて得た出力9と少なくとも等しい結果となる。
図2において、モジュール10によって事前の適応化をさせるかまたはV1データモデルdmiのデータを用いて新しいV2データモデルDMiへ変換する可能性が、点線で示されている。データモデルのかかる事前の適応化または変換は、上述したように、可能な限りにおいて小規模に行うことは可能である。したがって、本発明では、平行したデータモデル適応化がなされ、フィードバックループ8と8‘とを比較し、移行期間後は、認識パフォーマンスの損失なしにバージョンV1から新しいバージョンV2に切替えられる。
図3は、バージョンV1およびV2の平行したインプリメンテーション、およびV2に関連したデータモデルDMの適応化のレベルに応じた第1の適応化データ処理バージョンV1から第2の適応化データ処理バージョンV2への切り替えに関するフローチャートを示す。簡略化のために、それぞれ、1データモデルdmまたはDMだけに言及するが、データモデルの数が上述したようにそれより多いことは、自明である(たとえば自動音声認識変換の場合、ユーザにつき4つのデータモデル)。図3によれば、第1のソフトウェアバージョンV1は、ブロック11に従ってインストールされる。さらにまた、ブロック12に従って、V1に関連したデータモデルdmの第1世代がインストールされる。
その後、音声ファイルが記憶され、比較ブロック13で、このV1データモデル#1を基に音声ファイルは自動的に認識されテキストファイルに変換されて、自動的に得られたテキストファイルは修正される。そして、テキストファイルへの修正を基にデータモデルdm#1の適応化が実行される。テキストファイルは、その後出力される。これらのステップは、図3のブロック14で表される。この実施例において、自動認識および変換は、ユーザと関連したデータモデルを基に、1人の特定のユーザに関してなされることをここで述べておかなければならない。そして、データモデルdmは、その時点で利用できる音声/認識/修正テキストの三つの組を基に適応化される。しかしながら、上述したように、多数のユーザ数がシステムに接続されるため、各ユーザまたは各ユーザに特有のデータモデルのために、対応するデータ処理および適応結果が組み込まれる必要がある。
音声ファイルが自動的に認識されて、テキストファイルに変換され、そして、対応するテキストファイルが修正される場合に、もちろんその都度データモデルを適応化させる必要はない。その代わりに、多くのかかる音声/認識/修正テキストの三つの組を累積して、予め定められた量の適応化のデータが得られた後にのみ、データモデルdmを適応化させることも可能である。
図3のブロック15は、現在の、適応化したデータモデル(dmの#2世代)の存在を指す。
以下において、ブロック13、14、15によるステップは、何度も繰り返される。そして、よくトレーニングされたデータモデルdmの高次の世代に至り、終わると予想される。
その段階で、第2のソフトウェアバージョンV2がブロック21においてインストールされる。そして、ブロック22において、それとともにこれと関連する最初のデータモデルDMがインプリメントされる。そのデータモデルDMとこの第2のソフトウェアバージョンV2は、高次の世代のdmデータモデルを有する第1のソフトウェアバージョンV1と平行して動作する。特定のユーザのために更なる音声ファイルは、ブロック23に従って録音される。ブロック14‘において、ソフトウェアバージョンV1を用いて、この音声ファイルは、上述したように再び認識されて、自動的にテキストファイルに変換される。そして、おそらく、更新処理またはバージョンV1のための対応するデータモデルdmの適応化が、ブロック15‘において行われる。
これらのステップと平行して、第2のソフトウェアバージョンV2を基に、音声ファイルは、自動的に認識され、そして、対応するデータモデルDMの中でテキストファイルに変換される。そして、得られた修正を含むテキストファイルが提供される。修正は、ブロック14‘に従ってテキストファイルを修正するときに入力される。テキストファイルの修正、それに続くV2データモデルDMの適応化は、図3のブロック25で行われる。なお、DMが適応化する前に、多くの音声/認識/修正テキストの三つの組を累積してもよい。ステップ26において、アップデートされたV2データモデルがすでに有益かどうかはそれから調べられる。そして、これは例えばV2データモデルのためにトレーニングされたデータ量を基に決定される。NOの場合は、既に述べたバージョンV1およびV2を基に平行したデータ処理がブロック23に戻ることによって続けられる。しかしながら、ステップ26の判断により、前述の処理ステップで連続的に適応化し十分にトレーニングしたデータモデルDMを使用することによって、新しいソフトウェアバージョンV2を用いて少なくとも十分な結果が得られる場合には(図3ブロック27‘参照)、バージョンV2だけのデータ処理が続けられる。そしてV1データモデルを基にしたV1バージョンのデータ処理は止められる(図3のブロック27)。データ処理(音声およびテキストファイルの受領、認識、変換および修正)は、対応するアップデートされたデータモデルDMのみと協働する新しいソフトウェアバージョンV2を基に続けられる。そして、図3に示されるように、ステップ23、24、25に続く。加えて、バージョンV2および連続的にアップデートされ適応化されたV2データモデルを用いて得られた修正テキストファイルがシステムの出力として提供されることは明らかである(図2の出力9‘と比較されたい)。
図4は本システムのブロック図を示す。インタフェースモジュール31によって、ネットワーク3に接続されたシステム4〜7を示す。このブロック図において、二つのブランチが示されている。それぞれ、ソフトウェアバージョンV1またはV2に対応する。モジュール32.1および32.2により、音響ファイルまたは音声ファイルが受け取られることが示される。そして、認識および変換モジュール33.1および33.2が続く(図1のステーション4と比較されたい)。この音声ファイルの自動認識および変換は、それぞれデータモデルdmおよびDMを基に行われる。dmおよびDMは、それぞれデータベース7.1および7.2に格納される。データベース7.1および7.2は、図1に示したように、データベース7の部分でもよい。
図4の記載は、理解を簡単にするために単純化され、データベース5のスピーチファイル(音声ファイル)の記憶は、例示されていない。
その後、それぞれの修正ステーション6(図1)において、自動認識出力および変換モジュール33.1または33.2で得られた変換テキストファイルは、モジュール34.1および34.2(図4)またはステーション6(図1)において修正される。特定の修正ステーション6で実施される全く同一の修正作業がモジュール34.1および34.2に従ってファイルが修正される点に留意すべきである(図4)。この修正は、データベース7.1のデータモデルdmおよびデータベース7.2のDMの適応化に出力される。さらに、新しいソフトウェアバージョンV2のブランチにおいて、対応するアップデート情報がデータベース7.2に提供されるときに、V2データモジュールDMのためのトレーニング(アップデート)されたデータの量(具体的にはキロバイト)を計数するために、カウンタモジュール35が修正モジュール34.2に接続されている。そして、対応する情報は意思決定および制御モジュール36に提供される。意思決定および制御手段モジュール36は、コンパレータモジュール37を含む。このコンパレータでは、データモジュールDMの適応化に関する受信データの量が予め定められ保存されたトレーニングされるデータ量と比較される。この予め定められたデータ量に達するとすぐに、モジュール36はV1結果出力39.1からV2結果出力39.2に自動的に切り替えるために交換モジュール38を起動させる。それぞれの修正V2テキストファイルは、モジュール40に出力される。
V1出力からV2出力への自動切り替えの他の方策として、修正の前にそれぞれの結果として生じるテキストファイルを比較してもよい。これは、自動変換の後、より好ましくは、自動的に変換されたテキストファイルを修正するのに必要な補正データの量の後が望ましい。これは、図4において、コンパレータ37‘を有する破線によって示されている。さらに別の可能性は、それぞれのV1およびV2の結果の推定に基づいて、強制的に切り替えモジュール36を起動させることである。これは、図4の41に破線で示されている。
上述のように、本発明の好ましい実施例の記載に関する限り、さまざまな変更が本発明の範囲内で可能であることが更に明らかにされなければならない。特に、本発明は他の分野のデータ処理にも適用できる。膨大なデータ量が使われる場合で、特にデータモデルをアップデートし、以前のデータモデルの不十分なデータからみて、新しい最初のデータモデルの事前トレーニングが不可能な分野である。または、この事前トレーニングに時間がかかり過ぎる分野、またはV1データモデルがV2データモデルに全く変換できない分野である。本発明は、画像データ処理の分野、たとえば、衛星から得られるビデオ情報に対して、または大量のサウンドデータに対して、ゲノム配列データに対して適用されてもよい。
別の実施例としては、図1のシステムと比較して、別のユニット42に第2のソフトウェアバージョンV2を単独でもってインストールして実行することである。これによって、V2バージョンを基にデータ処理動作に関する限り、上述したV1/V2の平行動作の過渡的な時期の間、認識/適応化ステーション4の負荷が軽くなる。もちろん、この修正は、V1バージョンからV2バージョンに切り替えるときに、それぞれ認識/適応化ステーション4に、V2バージョンがインストールされるかまたはダウンロードされなければならないことを意味する。これによって、V2バージョンおよび関連したデータモデルDMiを用いて、それぞれの音声ファイルを処理し、自動的にテキストファイルに変換することが可能となる。
なお、上述の実施例が本発明を制限するよりはむしろ、例示する点に留意する必要がある。そして、当業者は添付の請求の範囲の範囲内において、多くの別の実施例を設計することが可能である。請求項において、括弧の中に配置されるいかなる参照符号も、請求項を制限するものとして解釈されない。「comprising:有する、含む」の語は、請求項に記載されていない構成またはステップの存在を除外しない。「a」または「an」の語は、複数のかかる構成の存在を除外しない。本発明は、いくつかの異なった構成から成るハードウェアによって、そして、最適にプログラムされたコンピュータにより実施されてもよい。いくつかの手段を列挙しているシステムの請求項において、これらの手段のいくつかは、計算機可読のソフトウェアまたはハードウェアの全く同一のアイテムにより実施されてもよい。単に特定の方策が相互に異なる従属クレームにおいて記述されていても、これらの方策の組合せが有効に使われることができないことを意味するものではない。
データ処理システムの図である。特に音声認識の適応化システムを示す。スピーチデータが自動的にテキストファイルに変換される。次にテキストデータは、受け取られる音声ファイルを基に修正される。そして、対応するフィードバックが格納されたデータモデルを適応化させるために用いられる。 第1および第2のデータ処理ソフトウェアバージョンの平行的な使用を表す図である。関連したデータモデルへの平行した適応化によって、第1の適応化データ処理バージョンのデータ処理結果を用いて第2の適応化データ処理バージョンが、第2の適応化データ処理バージョンが十分な基準値に達するために、第1の適応化データ処理バージョンと平行して、バックグラウンドで動く。 第2の適応化データ処理バージョンの結果が十分になるまで、結果が使われる第1のものと平行して、第2の適応化データ処理バージョンを実行することに関する本発明による方法を例示しているフローチャートを表す図である。 第1の適応化データ処理バージョンと平行して第2のデータ処理ソフトウェアバージョンを実行させ、少なくとも第2の適応化データ処理バージョンを使用して同等のパフォーマンスが得られるとすぐに、第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるためのシステムを表す図である。

Claims (9)

  1. 少なくとも一つの第1のデータモデルに関連する第1のソフトウエアバージョンから、少なくとも一つの第2のデータモデルに関連する第2のソフトウエアバージョンに切り替える、少なくとも一つのプロセサが実行する方法であって、
    第1の入力データを処理し、関連する第1の結果を生成し、かつ前記少なくとも一つの第1のデータモデルが適応するように、前記第1のソフトウエアバージョンを実行するステップと;
    前記第1の入力データを処理し、関連する第2の結果を生成し、かつ前記少なくとも一つの第2のデータモデルが適応するように、前記第2のソフトウエアバージョンを実行するステップと;
    前記第2のソフトウエアバージョンのパフォーマンスが、少なくとも一つの品質基準を満たすかを判断するステップと;
    前記第2のソフトウエアバージョンの前記パフォーマンスが、前記少なくとも一つの品質基準を満たさない場合、利用のための第1の結果を出力するステップと;
    前記第2のソフトウエアバージョンの前記パフォーマンスが、前記少なくとも一つの品質基準を満たす場合、利用のための第2の結果を出力するステップと;
    を有することを特徴とする方法。
  2. 前記第2のソフトウエアバージョンにより前記第1の入力データを処理することは、前記少なくとも一つの第2のデータモデルを適応させるためにトレーニングデータの少なくとも一部分が利用されることとなり、トレーニングデータが予め定められた量を超えた場合、前記第2のソフトウエアバージョンの前記パフォーマンスは、前記少なくとも一つの品質基準を満たすことを特徴とする請求項1に記載の方法。
  3. 前記第2のソフトウエアバージョンの推定されたパフォーマンスが、推定された前記第1のソフトウエアバージョンのパフォーマンスと一致し又はこれを超えた場合、前記第2のソフトウエアバージョンの品質基準は、前記少なくとも一つの品質基準を満たすことを特徴とする請求項1に記載の方法。
  4. 前記第2の結果を前記第1の結果と比較するステップを更に有し、前記第2の結果が前記第1の結果と等しいか又はより優れていると判断される場合、前記第2のソフトウエアバージョンは、前記少なくとも一つの品質基準を満たすことを特徴とする請求項1に記載の方法。
  5. 前記第1のソフトウエアバージョンは、第1の音声認識ソフトウエアバージョンを有し、かつ前記第2のソフトウエアバージョンは、第2の音声認識ソフトウエアバージョンを有し、前記第1の入力データは、スピーチデータを含み、前記第1の結果及び前記第2の結果は、前記スピーチデータを処理することによって、それぞれ、前記第1の音声認識ソフトウエアバージョン及び前記第2の音声認識ソフトウエアバージョンにより認識されたテキストを含み、かつ、前記少なくとも一つの第1のデータモデル及び前記少なくとも一つの第2のデータモデルは、それぞれ、音響モデル、言語モデル、文法モデル、及び/又は、辞書モデルを含むことを特徴とする請求項1ないし4のいずれか1項に記載の方法。
  6. 少なくとも一つのプロセッサに、請求項1ないし5のいずれか1項に記載の方法を実行させるためのプログラム。
  7. 少なくとも一つの第1のデータモデルに関連する第1のソフトウエアバージョンから、少なくとも一つの第2のデータモデルに関連する第2のソフトウエアバージョンに切り替えるよう構成された、データ処理システムであって、
    前記第1のソフトウエアバージョン及び前記第2のソフトウエアバージョンを格納するための少なくとも一つの格納媒体と;
    前記少なくとも一つの格納媒体にアクセスすることができる少なくとも一つのプロセッサであって、
    第1の入力データを処理し、関連する第1の結果を生成し、かつ前記少なくとも一つの第1のデータモデルが適応するように、前記第1のソフトウエアバージョンを実行し;
    前記第1の入力データを処理し、関連する第2の結果を生成し、かつ前記少なくとも一つの第2のデータモデルが適応するように、前記第2のソフトウエアバージョンを実行し;
    前記第2のソフトウエアバージョンのパフォーマンスが、少なくとも一つの品質基準を満たすかを判断し;
    前記第2のソフトウエアバージョンの前記パフォーマンスが、前記少なくとも一つの品質基準を満たさない場合、利用のための第1の結果を出力し;
    前記第2のソフトウエアバージョンの前記パフォーマンスが、前記少なくとも一つの品質基準を満たす場合、利用のための第2の結果を出力する;
    よう構成されたプロセッサと;
    を有することを特徴とするシステム。
  8. 前記第2のソフトウエアバージョンにより前記第1の入力データを処理することは、前記少なくとも一つの第2のデータモデルを適応させるためにトレーニングデータの少なくとも一部分が利用されることとなり、トレーニングデータが予め定められた量を超えた場合、前記第2のソフトウエアバージョンの前記パフォーマンスは、前記少なくとも一つの品質基準を満たすことを特徴とする請求項7に記載のシステム。
  9. 前記第2のソフトウエアバージョンの推定されたパフォーマンスが、推定された前記第1のソフトウエアバージョンのパフォーマンスと一致し又はこれを超えた場合、前記第2のソフトウエアバージョンの品質基準は、前記少なくとも一つの品質基準を満たすことを特徴とする請求項7に記載のシステム。
JP2009508650A 2006-05-12 2007-05-09 第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法 Expired - Fee Related JP5208104B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06113888.9 2006-05-12
EP06113888 2006-05-12
PCT/IB2007/051734 WO2007132404A2 (en) 2006-05-12 2007-05-09 Method for changing over from a first adaptive data processing version to a second adaptive data processing version

Publications (2)

Publication Number Publication Date
JP2009537037A JP2009537037A (ja) 2009-10-22
JP5208104B2 true JP5208104B2 (ja) 2013-06-12

Family

ID=38694287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009508650A Expired - Fee Related JP5208104B2 (ja) 2006-05-12 2007-05-09 第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法

Country Status (5)

Country Link
US (1) US9009695B2 (ja)
EP (1) EP2019985B1 (ja)
JP (1) JP5208104B2 (ja)
CN (1) CN101443732A (ja)
WO (1) WO2007132404A2 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8056070B2 (en) * 2007-01-10 2011-11-08 Goller Michael D System and method for modifying and updating a speech recognition program
US8365140B2 (en) * 2007-12-20 2013-01-29 Hsbc Technologies Inc. Automated methods and systems for developing and deploying projects in parallel
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
DE102010012622B4 (de) * 2010-03-24 2015-04-30 Siemens Medical Instruments Pte. Ltd. Binaurales Verfahren und binaurale Anordnung zur Sprachsteuerung von Hörgeräten
KR20120046627A (ko) * 2010-11-02 2012-05-10 삼성전자주식회사 화자 적응 방법 및 장치
CN104756185B (zh) * 2012-11-05 2018-01-09 三菱电机株式会社 语音识别装置
US9256850B2 (en) 2012-11-21 2016-02-09 International Business Machines Corporation Orphan token management during in-flight process system migration
US9786296B2 (en) * 2013-07-08 2017-10-10 Qualcomm Incorporated Method and apparatus for assigning keyword model to voice operated function
CN103903613A (zh) * 2014-03-10 2014-07-02 联想(北京)有限公司 一种信息处理方法及电子设备
CN105355198B (zh) * 2015-10-20 2019-03-12 河海大学 一种基于多重自适应的模型补偿语音识别方法
US10475471B2 (en) * 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
US10242696B2 (en) * 2016-10-11 2019-03-26 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications
US10152318B2 (en) * 2017-01-31 2018-12-11 Oracle Financial Services Software Limited Computer system and method for executing applications with new data structures
CN107783896B (zh) * 2017-02-16 2020-10-02 平安科技(深圳)有限公司 一种数据处理模型的优化方法和装置
US9741337B1 (en) * 2017-04-03 2017-08-22 Green Key Technologies Llc Adaptive self-trained computer engines with associated databases and methods of use thereof
JP6883471B2 (ja) * 2017-05-11 2021-06-09 オリンパス株式会社 収音装置、収音方法、収音プログラム、ディクテーション方法及び情報処理装置
CN110858479B (zh) * 2018-08-08 2022-04-22 Oppo广东移动通信有限公司 语音识别模型更新方法、装置、存储介质及电子设备
CN109901979A (zh) * 2019-01-24 2019-06-18 平安科技(深圳)有限公司 模型优化智能评估方法、服务器及计算机可读存储介质
US20220366911A1 (en) * 2021-05-17 2022-11-17 Google Llc Arranging and/or clearing speech-to-text content without a user providing express instructions

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2584249B2 (ja) * 1986-10-31 1997-02-26 三洋電機株式会社 音声認識電話機
US5410703A (en) * 1992-07-01 1995-04-25 Telefonaktiebolaget L M Ericsson System for changing software during computer operation
US5917891A (en) * 1996-10-07 1999-06-29 Northern Telecom, Limited Voice-dialing system using adaptive model of calling behavior
US6167117A (en) * 1996-10-07 2000-12-26 Nortel Networks Limited Voice-dialing system using model of calling behavior
US6173259B1 (en) * 1997-03-27 2001-01-09 Speech Machines Plc Speech to text conversion
US5983242A (en) * 1997-07-01 1999-11-09 Microsoft Corporation Method and system for preserving document integrity
JP2000259420A (ja) 1999-03-05 2000-09-22 Denso Corp 電子制御装置用の学習値更新装置
JP2001100781A (ja) * 1999-09-30 2001-04-13 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
US6629315B1 (en) * 2000-08-10 2003-09-30 International Business Machines Corporation Method, computer program product, and system for dynamically refreshing software modules within an actively running computer system
US20020169605A1 (en) * 2001-03-09 2002-11-14 Damiba Bertrand A. System, method and computer program product for self-verifying file content in a speech recognition framework
US20020143540A1 (en) * 2001-03-28 2002-10-03 Narendranath Malayath Voice recognition system using implicit speaker adaptation
DE10127559A1 (de) 2001-06-06 2002-12-12 Philips Corp Intellectual Pty Benutzergruppenspezifisches Musterverarbeitungssystem
US6996525B2 (en) * 2001-06-15 2006-02-07 Intel Corporation Selecting one of multiple speech recognizers in a system based on performance predections resulting from experience
US6704432B2 (en) * 2001-10-18 2004-03-09 Microsoft Corporation Extensible file format
US20030145315A1 (en) * 2002-01-23 2003-07-31 Tuomo Aro Exchange of data between components of distributed software having different versions of software
CA2483287C (en) * 2002-05-11 2009-10-13 Accenture Global Services Gmbh Automated software testing system and method
US20030225719A1 (en) * 2002-05-31 2003-12-04 Lucent Technologies, Inc. Methods and apparatus for fast and robust model training for object classification
US7370316B2 (en) * 2003-06-03 2008-05-06 Sap Ag Mining model versioning
US7949533B2 (en) * 2005-02-04 2011-05-24 Vococollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US7793269B2 (en) * 2005-02-15 2010-09-07 Ebay Inc. Parallel software testing based on a normalized configuration
US20070106685A1 (en) * 2005-11-09 2007-05-10 Podzinger Corp. Method and apparatus for updating speech recognition databases and reindexing audio and video content using the same
TWI311311B (en) * 2006-11-16 2009-06-21 Inst Information Industr Speech recognition device, method, application program, and computer readable medium for adjusting speech models with selected speech data
US8219407B1 (en) * 2007-12-27 2012-07-10 Great Northern Research, LLC Method for processing the output of a speech recognizer

Also Published As

Publication number Publication date
CN101443732A (zh) 2009-05-27
WO2007132404A2 (en) 2007-11-22
EP2019985A2 (en) 2009-02-04
WO2007132404A3 (en) 2008-05-08
EP2019985B1 (en) 2018-04-04
JP2009537037A (ja) 2009-10-22
US20090125899A1 (en) 2009-05-14
US9009695B2 (en) 2015-04-14

Similar Documents

Publication Publication Date Title
JP5208104B2 (ja) 第1の適応化データ処理バージョンから第2の適応化データ処理バージョンに切り替えるための方法
US6366882B1 (en) Apparatus for converting speech to text
US7562014B1 (en) Active learning process for spoken dialog systems
GB2323694A (en) Adaptation in speech to text conversion
US7487087B2 (en) Method of speech recognition using variational inference with switching state space models
JP2006171710A (ja) 音響情報から意味的な意図を識別するためのシステムおよび方法
JP2002091477A (ja) 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
KR101131278B1 (ko) 대화 로그를 이용한 학습 기반 대화 시스템 성능 향상 방법 및 그 장치
JP2001125588A (ja) 音声認識装置及び方法ならびに記録媒体
JP4464770B2 (ja) 対話戦略学習方法および対話戦略学習装置
JP3541224B2 (ja) 音源の分離方法および分離装置
JP4964194B2 (ja) 音声認識モデル作成装置とその方法、音声認識装置とその方法、プログラムとその記録媒体
JP2012173592A (ja) 音源パラメータ推定装置と音源分離装置とそれらの方法とプログラム
WO2008056604A1 (fr) Système de collecte de son, procédé de collecte de son et programme de traitement de collecte
JP4990822B2 (ja) 辞書修正装置、システム、およびコンピュータプログラム
JP3006496B2 (ja) 音声認識装置
WO2010109725A1 (ja) 音声処理装置、音声処理方法、及び、音声処理プログラム
JP3912089B2 (ja) 音声認識方法および音声認識装置
JP3091648B2 (ja) 隠れマルコフモデルの学習方法
JP7146038B2 (ja) 音声認識システム及び方法
US20230325612A1 (en) Multi-platform voice analysis and translation
JPH0822296A (ja) パターン認識方法
JPH0769711B2 (ja) 音声認識方法
JP2005017603A (ja) 音声認識率推定方法及び音声認識率推定プログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20090715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120822

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5208104

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees