JP2006011271A

JP2006011271A - 音声認識文法作成装置及びその制御方法

Info

Publication number: JP2006011271A
Application number: JP2004191596A
Authority: JP
Inventors: Kazue Kaneko; 和恵金子; Michio Aizawa; 道雄相澤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2004-06-29
Filing date: 2004-06-29
Publication date: 2006-01-12
Anticipated expiration: 2024-06-29
Also published as: US20050288931A1; JP4579595B2; US7603269B2

Abstract

【課題】従来の、構成要素の順番を入れ替え且つ省略可能な構成要素の組み合わせも考慮したルールを全て作成しなければならない、という煩雑な手間を解消可能とした音声認識文法作成装置を提供する。
【解決手段】音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化し、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する。
【選択図】図１

Description

本発明は、音声認識可能な語や文を記述して音声認識文法として作成する音声認識文法作成装置及びその制御方法に関する。

従来、音声認識装置において、予め音声認識できる内容を音声認識文法として記述しておく場合、音声認識文法を構文記述用の表記方法である拡張ＢＮＦ（Augmented Backus Naur Format）形式で記述することが一般的に行われている。拡張ＢＮＦ形式の音声認識文法では、省略可能な部分の記述が可能であるが、省略可能部分は、ある範囲について指定するもので、省略可能部分が全て省略されるか、全て発話されるかのどちらかの記述しかできない。

他方、音声認識対象の文を構成する構成要素（単語）の順序が固定でない場合の、構成要素の組み合わせについて、機能を拡張した音声認識文法を記述することができる音声認識装置に関する技術が提案されている（例えば、特許文献１参照）。しかし、該提案は構成要素の省略について扱うものではない。

また、音声認識文法は、テキストとしてテキストエディタで記述することが一般的ではあるが、現在では、GUI（Graphical User Interface）を使用することにより音声認識文法をグラフィカルに記述するものもある。しかし、省略可能な構成要素の組み合わせを扱うものはない。
特開２００１−１８８５６０号公報

上述した音声認識文法を記述する際、何らかのデフォルト値が想定されており、音声認識対象の文を構成する構成要素（単語）全てをユーザが発声しなくても機能するようなルールを記述したい場合が往々にして出てくる。例えば、時刻を表すルールを記述する場合、音声認識装置側でユーザが「○時○分○秒」と構成要素全てを発声した場合を受け入れるだけでなく、「○時○分」、「○時○秒」、「○分○秒」、「○時」、「○分」、「○秒」などの発声も受け入れるルールを記述したいとする。

その場合、以下に示すように構成要素それぞれを省略可能にしてしまうと、そのルールでは、全ての構成要素が省略可能となり、何も発声がない場合にもマッチングするルールを記述することになる。

<時刻>＝[<時>][<分>][<秒>]
上記表記において、< >内はノンターミナルノード（ルール名）を示し、[ ]内は省略可能を示す。

ルールを厳密に記述しようとすると、以下に示す３種類の組み合わせを作成しなければならず、構成要素の数が増えれば増えるほど組み合わせの数も増える。

<時刻>＝<時>[<分>][<秒>] ｜ <分>[<秒>] ｜ <秒>
上記表記において、｜はＯＲ結合を示し、構成要素の並びはＡＮＤ結合を示す。

また、順序が不定で省略可能な構成要素からなるルールを記述する場合は、構成要素の順序の組み合わせについても考慮してルールを作成しなければならず、順序の組み合わせの数は更に増える。

例えば、音声入力により複写動作に対する各種指定を行うことが可能な複写機の操作タスクにおいて、<用紙選択> <拡大縮小> <片面両面> <ソータ> <濃さ> <部数> などの指定要素があり、それぞれの指定要素に省略された際のデフォルトが設定されている場合を想定する。この場合には、ユーザは、指定要素の順番を入れ替えると共に省略可能な指定要素の組み合わせも考慮したルールを全て作成しなくてはならず、極めて煩雑であり手間がかかるという問題がある。

本発明の目的は、従来の、構成要素の順番を入れ替え且つ省略可能な構成要素の組み合わせも考慮したルールを全て作成しなければならない、という煩雑な手間を解消することを可能とした音声認識文法作成装置及びその制御方法を提供することにある。

上述の目的を達成するために、本発明は、音声認識対象を音声認識文法として記述する音声認識文法作成装置において、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化するグループ化手段と、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成手段とを備えることを特徴とする。

上述の目的を達成するために、本発明は、音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法において、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化するグループ化工程と、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成工程とを備えることを特徴とする。

本発明により、省略可能な構成要素を含むグループを音声認識文法として記述する際に、構成要素の組み合わせについて重複やルールとしての適切さ等を考慮せずに直感的に記述することができるようになる。

以下、本発明の実施の形態を図面に基づき説明する。

［第１の実施の形態］
図１は、本発明の第１の実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。

図１において、音声認識文法作成装置は、文字・操作入力部１０１、画像表示部１０２、画像編集部１０３、拡張ＢＮＦ変換部１０４、ファイル入出力部１０５を備えている。

文字・操作入力部１０１は、キーボードやマウス等から構成されており、ユーザが音声認識文法作成装置に対する音声認識文法の作成指示や編集操作等を行う際に用いる。画像表示部１０２は、メタ言語（言語記述言語）形式の代表的なものである拡張ＢＮＦ形式のルールの組により定義される編集中の音声認識文法（図４、図６、図７参照）をグラフィカルに表示すると共に、画像表示部１０２の表示内容に応じたユーザによる文字・操作入力部１０１を介した操作に従い編集作業過程を表示することが可能である。

画像編集部１０３は、ユーザによる文字・操作入力部１０１を介した編集操作を受け入れて編集中の画像（図４、図６、図７参照）の変更を行う。拡張ＢＮＦ変換部１０４は、画像表示部１０２の表示内容に応じたユーザによる文字・操作入力部１０１を介した操作に従い、グラフィカルな表示の音声認識文法を拡張ＢＮＦ形式に変換する。ファイル入出力部１０５は、画像表示部１０２にグラフィカルに表示されている編集した音声認識文法や、拡張ＢＮＦ形式に変換された音声認識文法をファイルとして入出力する。

音声認識文法作成装置は、具体的にはコンピュータ等の情報処理装置から構成されており、情報処理装置に装備されているＣＰＵ、ＲＯＭ、ＲＡＭ、コントローラ、ハードディスク、ディスプレイ、キーボード、マウス等が図１の各部の機能に対応している。即ち、文字・操作入力部１０１は、キーボードやマウス等に対応し、画像表示部１０２は、ディスプレイに対応し、画像編集部１０３、拡張ＢＮＦ変換部１０４、ファイル入出力部１０５は、ＣＰＵ、メモリコントローラ、制御プログラムの機能等に対応する。ＣＰＵはＲＯＭ或いはハードディスクに格納された制御プログラムに基づき図３のフローチャートに示す処理を実行する。

図２は、従来扱われている拡張ＢＮＦ形式で表現可能な音声認識文法の例を示す図である。

図２において、２０１、２０２、２０３は、音声認識文法を画像表示部１０２にグラフィカルに表示したものと、音声認識文法を拡張ＢＮＦ形式で表現したものとを対にして示したものである。

音声認識文法のグラフィカルな表記については、以下の表記方法をとる。角の丸い長方形はノンターミナルノード（ルール名）を示し、角の尖った長方形はターミナルノード（単語）を示す。一番左端の角の丸い長方形がルールの左辺を示し、それより矢印で示される角の尖った長方形がルールの右辺を示す。枠線が点線になっている長方形はその箇所が省略可能であることを示す。矢印（→）で直列に接続されている部分はＡＮＤ結合を示し、矢印（→）で並列に接続されている部分はＯＲ結合を示す。

音声認識文法の拡張ＢＮＦ形式での表記については、以下の表記方法をとる。< >で囲まれたものがノンターミナルノード（ルール名）を示し、“”で囲まれたものがターミナルノード（単語）を示す。＝の左側がルールの左辺を示し、＝の右側がルールの右辺を示す。[ ]で囲まれている部分は省略可能な部分を示す。ルールの右辺の｜はＯＲ結合を示し、｜がない場合はＡＮＤ結合を示す。

２０１のルール１は、音声認識装置がユーザの「おはようみなさん」という発声を受け入れることを示す。２０２のルール２は、音声認識装置がユーザの「おはようみなさん」と「おはよう」という発声を受け入れることを示す。２０３のルール３とルール４は、音声認識装置がユーザの「おはようみなさん」、「こんにちはみなさん」、「おはよう」、「こんにちは」という発声を受け入れることを示す。

次に、本実施の形態の音声認識文法作成装置における特徴的な処理を図３及び図４を参照しながら説明する。

図３は、少なくとも１つの構成要素は省略できない（最低１つの構成要素を残して他の構成要素を省略可能な）省略可能グループの拡張ＢＮＦ形式への変換処理を示すフローチャートである。本フローチャートに示す処理は、省略可能グループの内部展開についてのみ示すものであり、図２に示したような従来のルールについて拡張ＢＮＦ形式へ変換する手法については省略する。

図３において、まず、拡張ＢＮＦ変換部１０４は、ｎ個の構成要素のうち当該構成要素（ノード）が省略可能グループであるかどうかの判定を行う（ステップＳ３０１）。当該構成要素（ノード）が省略可能グループでないと判定した場合は、拡張ＢＮＦ変換部１０４は、本処理をそのまま終了する。当該構成要素（ノード）が省略可能グループであると判定した場合は、拡張ＢＮＦ変換部１０４は、構成要素に順序指定があるかどうかの判定を行う（ステップＳ３０２）。

構成要素に順序指定があると判定した場合は、拡張ＢＮＦ変換部１０４は、n個の構成要素について１〜ｎ個までの順列の作成を行う（ステップＳ３０３）。構成要素に順序指定がないと判定した場合は、拡張ＢＮＦ変換部１０４は、ｎ個の構成要素について１〜ｎ個までの組み合わせの作成を行う（ステップＳ３０４）。これにより、本処理を終了する。

図４は、省略可能グループを拡張ＢＮＦ形式に変換した例を示す図である。

図４において、４０１は、時刻を示すルールの例であり、構成要素の順序は指定されているが、最低（少なくとも）１つの構成要素を残して他の構成要素を省略可能なグループの例を示すものである。時、分、秒を囲んだ実線の長方形はグループを示す。尚、具体的な<時>や<分>や<秒>のルール定義は省略する。

４０１の例では、拡張ＢＮＦ形式の記述で省略可能な記号[ ]を用いているので、構成要素の組み合わせは３通りであるが、拡張ＢＮＦ形式の記述で省略可能な記号[ ]を用いない場合は、構成要素の組み合わせは以下に示すように３*２*１=６通りとなる。

<時刻>＝<時><分><秒>
｜<時><分>
｜<時><秒>
｜<分><秒>
｜<分>
｜<秒>
４０２は、朝食のオーダーを示すルールの例であり、構成要素の順序が指定されていない例を示すものである。<飲み物>には“コーヒー”、“紅茶”など、<パン>には“トースト”、“クロワッサン”など、<卵>には“オムレツ”、“目玉焼き”などが考えられるが、具体例は省略する。

４０２の例では、拡張ＢＮＦ形式の記述で省略可能な記号[ ]を用いているので、構成要素の組み合わせは９通りであるが、拡張ＢＮＦ形式の記述で省略可能な記号[ ]を用いない場合は、構成要素の組み合わせは以下に示すように３*２*１+３*２+３=１５通りとなる。

<朝食>＝<飲み物><パン><卵>
｜<飲み物><パン>
｜<飲み物><卵><パン>
｜<飲み物><卵>
｜<飲み物>
｜<パン><飲み物><卵>
｜<パン><飲み物>
｜<パン><卵><飲み物>
｜<パン><卵>
｜<パン>
｜<卵><飲み物><パン>
｜<卵><飲み物>
｜<卵><パン><飲み物>
｜<卵><パン>
｜<卵>
本実施の形態では、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素を拡張ＢＮＦ変換部１０４によりグループ化し、グループ化された前記省略してはならない構成要素を含む構成要素を画像表示部１０２によりグラフィカルに表示し、表示内容に応じたユーザ操作に基づき、拡張ＢＮＦ変換部１０４により前記省略してはならない構成要素を含む構成要素の組み合わせを展開して拡張ＢＮＦ形式の音声認識文法を作成し出力する。

以上説明したように、本実施の形態によれば、省略可能な構成要素を含むグループを音声認識文法として記述する際に、構成要素の組み合わせについて重複やルールとしての適切さ等を考慮せずに直感的に記述することができるようになる。この結果、従来の、構成要素の順番を入れ替え且つ省略可能な構成要素の組み合わせも考慮したルールを全て作成しなければならない、という煩雑な手間を解消することが可能となり、ユーザに対し効率的な音声認識文法の作成を支援できるという効果を奏する。

［第２の実施の形態］
本発明の第２の実施の形態は、上述した第１の実施の形態に対して、音声認識文法作成装置が拡張ＢＮＦ変換部の代わりに遷移ネットワーク変換部を備える点において相違する。本実施の形態のその他の要素は、上述した第１の実施の形態（図１）の対応するものと同一なので、説明を省略する。

上述した第１の実施の形態では、拡張ＢＮＦ形式の音声認識文法に変換した例を説明したが、本実施の形態では、遷移ネットワークの形式に変換する例を説明する。

図５は、本実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。

図５において、音声認識文法作成装置は、文字・操作入力部５０１、画像表示部５０２、画像編集部５０３、遷移ネットワーク変換部５０４、ファイル入出力部５０５を備えている。

遷移ネットワーク変換部５０４は、省略可能グループを下記の図６に示す遷移ネットワーク形式に変換する。遷移ネットワーク形式とは、組み合わせ対象となる構成要素を矢印で結合して形成した構成要素結合関係を示すネットワークにより、構成要素の組み合わせを表す形式である。

図６は、省略可能グループの遷移ネットワーク形式への変換例を示す図である。

図６において、６０１は、時刻を示すルールの例を示すものである。時刻を示すルール６０１の構成要素の組み合わせは、図示の遷移ネットワーク形式への変換により、<時><分><秒>、<時><分>、<時><秒>、<時>、<分><秒>、<分>、<秒>となる。

６０２は、朝食のオーダーを示すルールの例を示すものである。朝食のオーダーを示すルール６０２の構成要素の組み合わせは、図示の遷移ネットワーク形式への変換により、<飲み物><パン><卵>、<飲み物><パン>、<飲み物><卵><パン>、<飲み物><卵>、<飲み物>、<パン><飲み物><卵>、<パン><飲み物>、<パン><卵><飲み物>、<パン><卵>、<パン>、<卵><パン><飲み物>、<卵><飲み物><パン>、<卵><パン>、<卵><飲み物>、<卵>となる。

本実施の形態では、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素を遷移ネットワーク変換部５０４によりグループ化し、グループ化された前記省略してはならない構成要素を含む構成要素を画像表示部５０２によりグラフィカルに表示し、表示内容に応じたユーザ操作に基づき、遷移ネットワーク変換部５０４により前記省略してはならない構成要素を含む構成要素の組み合わせを展開して遷移ネットワーク形式の音声認識文法を作成し出力する。

以上説明したように、本実施の形態によれば、第１の実施の形態と同様に、従来の、構成要素の順番を入れ替え且つ省略可能な構成要素の組み合わせも考慮したルールを全て作成しなければならない、という煩雑な手間を解消することが可能となり、ユーザに対し効率的な音声認識文法の作成を支援できるという効果を奏する。

［第３の実施の形態］
本発明の第３の実施の形態は、上述した第１及び第２の実施の形態に対して、下記の点において相違する。本実施の形態のその他の要素は、上述した第１及び第２の実施の形態（図１、図５）の対応するものと同一なので、説明を省略する。

上述した第１の実施の形態では、省略可能なグループの内部の順序指定を全部に行うか全部に行わないかの例を説明したが、本実施の形態では、省略可能なグループの内部を部分的に順序指定できるようにする例を説明する。

図７は、本実施の形態に係る省略可能グループの構成要素の部分的順序指定例を示す図である。

図７において、７０１は、構成要素Ａ〜Ｃに対するルールａの例を示すものである。７０１は、構成要素Ａ→構成要素Ｂへの順序を指定しており、構成要素Ａもしくは構成要素Ｂの省略は可能であるが、構成要素Ａと構成要素Ｂとの間には他のものが挿入されてはならない例であり、構成要素Ａと構成要素Ｂの接続を実線の矢印で表現している。

７０２は、構成要素Ａ〜Ｃに対するルールｂの例を示すものである。７０２は、構成要素Ａと構成要素Ｂの順序が逆にならない限り、構成要素Ａと構成要素Ｂとの間に構成要素Ｃの挿入が可能な例であり、構成要素Ａと構成要素Ｂの接続を点線の矢印で表現している。

本実施の形態では、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素の順序を指定して拡張ＢＮＦ変換部１０４（または遷移ネットワーク変換部５０４）によりグループ化し、グループ化された前記省略してはならない構成要素を含む構成要素を画像表示部１０２（または画像表示部５０２）によりグラフィカルに表示し、表示内容に応じたユーザ操作に基づき、拡張ＢＮＦ変換部１０４（または遷移ネットワーク変換部５０４）により前記省略してはならない構成要素を含む構成要素の組み合わせを展開して拡張ＢＮＦ形式（または遷移ネットワーク形式）の音声認識文法を作成し出力する。

［他の実施の形態］
上記第１乃至第３の実施の形態では、グループ化された省略してはならない構成要素を含む構成要素をグラフィカルに表示し、表示内容に応じたユーザ操作に基づいて音声認識文法を作成する例を説明したが、本発明はこれに限定されるものではなく、グラフィカルに表示せずに、グループ化された省略してはならない構成要素を含む構成要素に基づいて音声認識文法を作成するよう構成しても構わない。

上記第１乃至第３の実施の形態では、省略可能な構成要素を点線の枠線で表現し、構成要素のグループを実線の長方形で表現しているが、線の種類や形状は特定のものに限定されるものではない。構成要素については、例えば、枠線の太さや色や背景の色等で構成要素の区別をつけるようにしてもよい。また、グループ化については、例えば、構成要素を四角や円で囲むことでグループ化する方法や、構成要素の連続に下線を引くことでグループ化する方法などを用いてもよい。

上記第１乃至第３の実施の形態では、音声認識文法作成機能のみに限定し、音声認識部分については省略しているが、音声認識文法作成ツールの機能として、音声認識文法を使用して音声認識が試せるような構成にしてもよい。音声認識文法を使用して音声認識を試す構成（音声認識装置）を実現する場合、音声認識文法作成装置の他に音声入力装置が必要となる。この場合は、音声認識文法をファイルとして出力しなくても音声認識文法を利用することが可能となる。

上記第１乃至第３の実施の形態では、音声認識文法作成装置の適用分野については特に言及しなかったが、例えば音声入力機能を有する画像形成装置（プリンタ、複写機、複合機等）における操作タスクの指定要素（用紙選択、拡大縮小、部数等）の組み合わせ等、種々の分野に適用することが可能である。

本発明は、上述した実施の形態の機能を実現するソフトウェアのプログラム（図３のフローチャート）をコンピュータ又はＣＰＵに供給し、そのコンピュータ又はＣＰＵが該供給されたプログラムを読出して実行することによって、達成することができる。

この場合、上記プログラムは、該プログラムを記録した記憶媒体から直接供給されるか、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続される不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。

上記プログラムの形態は、オブジェクトコード、インタプリタにより実行されるプログラムコード、ＯＳ（オペレーティングシステム）に供給されるスクリプトデータ等の形態から成ってもよい。

また、本発明は、上述した実施の形態の機能を実現するソフトウェアのプログラムを記憶した記憶媒体をコンピュータ又はＣＰＵに供給し、そのコンピュータ又はＣＰＵが記憶媒体に記憶されたプログラムを読出して実行することによっても、達成することができる。

この場合、格納媒体から読出されたプログラムコード自体が上述した各実施の形態の機能を実現すると共に、そのプログラムコードを記憶した記憶媒体は本発明を構成する。

プログラムコードを記憶する記憶媒体としては、例えば、ＲＯＭ、ＲＡＭ、ＮＶ−ＲＡＭ、フロッピー（登録商標）ディスク、ハードディスク、光ディスク（登録商標）、光磁気ディスク、ＣＤ−ＲＯＭ、ＭＯ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＤＶＤ−ＲＷ、ＤＶＤ＋ＲＷ、磁気テープ、不揮発性のメモリカード等がある。

上述した実施の形態の機能は、コンピュータから読出されたプログラムコードを実行することによるばかりでなく、コンピュータ上で稼動するＯＳ等がプログラムコードの指示に基づいて実際の処理の一部又は全部を行うことによっても実現することができる。

本発明の第１の実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。従来扱われている拡張ＢＮＦ形式で表現可能な音声認識文法の例を示す図である。少なくとも１つの構成要素は省略できない省略可能グループの拡張ＢＮＦ形式への変換処理を示すフローチャートである。省略可能グループを拡張ＢＮＦ形式に変換した例を示す図である。本発明の第２の実施の形態に係る音声認識文法作成装置の構成を示すブロック図である。省略可能グループの遷移ネットワーク形式への変換例を示す図である。本発明の第３の実施の形態に係る省略可能グループの構成要素の部分的順序指定例を示す図である。

符号の説明

１０１文字・操作入力部
１０２画像表示部（提示手段に対応）
１０３画像編集部
１０４拡張ＢＮＦ変換部（グループ化手段、作成手段に対応）
１０５ファイル入出力部
５０１文字・操作入力部
５０２画像表示部（提示手段に対応）
５０３画像編集部
５０４遷移ネットワーク変換部（グループ化手段、作成手段に対応）
５０５ファイル入出力部

Claims

音声認識対象を音声認識文法として記述する音声認識文法作成装置において、
音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化するグループ化手段と、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成手段とを備えることを特徴とする音声認識文法作成装置。
前記グループ化手段でグループ化された前記省略してはならない構成要素を含む構成要素を提示する提示手段を更に備え、
前記作成手段は、前記提示手段の提示内容に応じたユーザ操作に基づいて、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成することを特徴とする請求項１記載の音声認識文法作成装置。
前記作成手段は、前記省略してはならない構成要素を含む構成要素の組み合わせを展開してメタ言語形式の音声認識文法を作成することを特徴とする請求項１記載の音声認識文法作成装置。
前記作成手段は、前記省略してはならない構成要素を含む構成要素の組み合わせを展開して遷移ネットワーク形式の音声認識文法を作成することを特徴とする請求項１記載の音声認識文法作成装置。
前記グループ化手段は、音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素の順序を指定してグループ化することを特徴とする請求項１記載の音声認識文法作成装置。
前記メタ言語形式は、拡張ＢＮＦ（Augmented Backus Naur Format）形式であることを特徴とする請求項３記載の音声認識文法作成装置。
前記遷移ネットワーク形式は、組み合わせ対象となる構成要素を矢印で結合して形成した構成要素結合関係を示すネットワークにより、構成要素の組み合わせを表す形式であることを特徴とする請求項４記載の音声認識文法作成装置。
前記提示手段は、グループ化された前記省略してはならない構成要素を含む構成要素をグラフィカルに表示することを特徴とする請求項２記載の音声認識文法作成装置。
前記提示手段は、前記提示手段の提示内容に応じたユーザ操作に基づく編集作業過程を表示可能であることを特徴とする請求項２記載の音声認識文法作成装置。
音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法において、
音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化するグループ化工程と、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成する作成工程とを備えることを特徴とする制御方法。
音声認識対象を音声認識文法として記述する音声認識文法作成装置の制御方法をコンピュータに実行させるプログラムにおいて、
音声認識対象としての少なくとも１つの省略してはならない構成要素を含む構成要素をグループ化するモジュールと、
前記省略してはならない構成要素を含む構成要素の組み合わせを展開して音声認識文法を作成するモジュールとを備えることを特徴とするプログラム。
請求項１１記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。