JP2000194533A

JP2000194533A - 音声コマンド注釈方法

Info

Publication number: JP2000194533A
Application number: JP11352577A
Authority: JP
Inventors: Michael L Rudd; マイケル・エル・ラッド; Thomas C Oliver; トーマス・シー・オリバー
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1998-12-23
Filing date: 1999-12-13
Publication date: 2000-07-14
Also published as: CN1258061A; CN1184614C; EP1014258A3; US6580838B2; EP1014258A2; US20020013701A1; US6295391B1

Abstract

(57)【要約】【課題】デジタルカメラやポータブル・ドキュメントス
キャナのような装置によって捕捉されたデータを、音声
コマンド注釈を通して自動的にルーティングするシステ
ムを提供する。【解決手段】本発明の一実施例によれば、装置によりイ
メージまたはドキュメントを捕捉した後、捕捉されたイ
メージまたはドキュメントの処置を制御するためユーザ
が装置内の音声ピックアップコンポーネントに話し掛け
ることによって、音声処置コマンドがなされる。音声入
力は装置内の音声コマンド注釈ファイルに記憶され、イ
メージまたはドキュメントファイルに関連づけられる。
イメージまたはドキュメントデータファイルをホストコ
ンピュータシステムにコピーすると、音声コマンド注釈
ファイルが自動的にそれにコピーされる。ホストコンピ
ュータシステムは音声コマンド注釈ファイルを処理し、
ファイル内に含まれる１つ以上のコマンドに関連づけら
れた１つ以上の命令を実行する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、デジタルカメラ、
携帯情報端末（ＰＤＡ）、ラップトップコンピュータお
よびハンドヘルド・ドキュメントスキャナ等、データを
記憶すると共にそのデータをパーソナルコンピュータに
アップロードまたはコピーする装置に関する。特に、本
発明は、これら装置のうちの１つが取込んだデータにつ
いて、パーソナルコンピュータにアップロードまたはコ
ピーした時に自動データルーティングを行うための音声
コマンド注釈方法に関する。

【０００２】デジタルカメラ、携帯情報端末（ＰＤ
Ａ）、ラップトップコンピュータおよびハンドヘルド・
ドキュメントスキャナ等の多くの装置は、あらゆるソー
スから多くの異なるイメージまたはドキュメントを収集
する能力を有している。多くの場合、ユーザは、取込ん
だ各イメージまたはドキュメントを用いて異なるタスク
を行うことを望む。例えば、同僚または友人にファック
スまたは電子メールで送信するものもあれば、ワードプ
ロセッシング・ドキュメントの一部となるものもあり、
更に、特定のロケーションに記憶する必要があるものも
ある。通常、そのような装置は、周期的にパーソナルコ
ンピュータに接続され、その収集されたイメージデータ
ファイルまたはドキュメントデータファイルは、グルー
プとして装置からパーソナルコンピュータにコピーされ
るか、または個々にコピーされる。いずれの場合も、ユ
ーザは、コピーした後に特定のイメージデータファイル
またはドキュメントデータファイルの各々を調べて、そ
のイメージまたはドキュメントを処理するかまたは適切
な場所に送信するよう処置しなければならない。すなわ
ち、イメージＡをこのフォーマットでここに保存する、
ドキュメントＢをそのフォーマットでそこに保存する、
イメージＣを電子メールのメッセージに添付する、ドキ
ュメントＤを同僚にファックス送信する、等である。こ
れは、特に膨大な数のイメージデータファイルおよびド
キュメントデータファイルが取込まれている場合に、非
常に時間を浪費する処理となる可能性がある。更に、出
張等長期の期間に亙ってイメージおよびドキュメントを
収集する場合、その人は、それらをパーソナルコンピュ
ータにコピーして処理およびルーティングを行うまで、
各々についてどのような操作を行うつもりであったか正
確に覚えていることは難しい。大抵の場合、ある人が取
り込んだイメージまたはドキュメントの処置を決定する
最適な時は、それを取込んだ時である。このように、本
技術分野では、ユーザが、イメージまたはドキュメント
を処理または処置するための音声処置コマンドを用い
て、取込んだイメージまたはドキュメントにその取込ん
だ時に注釈を付けることができるようにする、改良され
た方法または装置が必要とされていることは明白であ
る。それにより、イメージデータファイルまたはドキュ
メントデータファイルは、パーソナルコンピュータにコ
ピーまたはアップロードされた時に、音声コマンド注釈
ファイルに格納された音声処置コマンドに従って自動的
に処理または処置されることとなる。本発明は、本技術
分野におけるこれらおよび他の必要を満たしている。

【０００３】

【発明が解決しようとする課題】本発明の課題は、取込
んだイメージまたはドキュメントに注釈を、その取込み
時に付けることができるようにする方法を提供すること
にある。

【０００４】

【課題を解決するための手段】本発明のある態様では、
装置に内蔵された音声ピックアップ・コンポーネントを
用いて、取込まれた各イメージまたはドキュメントにつ
いて、音声により処置コマンドを生成し、それらを音声
コマンド注釈ファイルに格納することができる。

【０００５】本発明の他の態様では、イメージデータフ
ァイルまたはドキュメントデータファイルを、その対応
する音声コマンド注釈ファイルと共にホストコンピュー
タにコピーする。

【０００６】また、本発明の他の態様では、関連するイ
メージデータファイルまたはドキュメントデータファイ
ルをホストコンピュータにコピーした後に、ホストコン
ピュータ内で上記音声コマンド注釈ファイルを自動的に
処理し、その音声コマンド注釈ファイル内の音声処置コ
マンドに対応する命令のセットを実行する。

【０００７】更に、本発明の他の態様では、イメージデ
ータファイルまたはドキュメントデータファイルについ
て、音声処置コマンドおよび音声コマンド注釈ファイル
を、同じイメージデータファイルまたはドキュメントデ
ータファイルの記述的な音声注釈および音声注釈ファイ
ルと区別する。

【０００８】本発明の他の態様では、装置内で音声分析
ソフトウェアを用いて音声処置コマンドを処理する。

【０００９】本発明の他の実施の形態における更に他の
態様では、ホストコンピュータ内で音声分析ソフトウェ
アを用いて音声処置コマンドを処理する。

【００１０】本発明の他の態様では、同じイメージデー
タファイルまたはドキュメントデータファイルに対し多
数の音声処置コマンドを作成し、その多数の音声処置コ
マンドを関連する音声コマンド注釈ファイルに格納す
る。

【００１１】本発明の更に他の態様では、コピーされた
イメージデータファイルまたはドキュメントデータファ
イルに関連する音声コマンド注釈ファイルを処理し、そ
の音声コマンド注釈ファイル内の音声処置コマンドに関
連する命令を実行する。その場合、ユーザは、その命令
のセットを実行するために必要な追加のデータ入力を行
うよう要求される場合がある。

【００１２】本発明の更に他の態様では、音声処置コマ
ンドと、取込まれて音声コマンド注釈ファイルに格納さ
れる音声データ入力とを区別する。なお、この音声コマ
ンド注釈ファイルに基づいて、音声処置コマンドに関連
する命令により処置が施されるようになっている。

【００１３】本発明の上記および他の態様は、イメージ
またはドキュメントを取込み、それらをイメージデータ
ファイルまたはドキュメントデータファイルとして内部
メモリに格納する装置において実行される。これら装置
は、イメージまたはドキュメントが取込まれた時、イメ
ージデータファイルまたはドキュメントデータファイル
をホストコンピュータにコピーまたはアップロードした
後にそれらの処理および処置を制御する音声処置コマン
ドを、ユーザから受取ることができる。音声入力は、他
の種類のユーザインタフェースを設けるには十分なスペ
ースを有していない小さい装置に非常に適している。

【００１４】例えば、ユーザは、ポータブル・ハンドヘ
ルド・ドキュメントスキャナによってドキュメントを走
査した後、ポータブルスキャナ内の音声ピックアップ・
コンポーネント（一般にはマイクロフォン）に向かって
音声を入力することにより、「ファックス」、「電子メ
ール」または「印刷および保存」等の音声処置コマンド
を作成することができる。音声ピックアップ・コンポー
ネントは、取込まれたオーディオ入力をアナログ信号に
変換する。そのアナログ信号は、アナログデジタル変換
器によってデジタル信号に変換される。また、そのデジ
タル信号は、コントローラが音声分析ソフトウェアにア
クセスして処理することにより認識パターンに変換され
る。そして、その認識パターンは、内部メモリに格納さ
れている予め決められた認識パターンのセットと比較さ
れる。それらに一致するものが無い場合、装置はユーザ
に、その音声処置コマンドが有効でないというメッセー
ジを出力する。これは、ユーザの音声入力が速すぎる
か、遅すぎるか、弱すぎるか、音声ピックアップ・コン
ポーネントから離れすぎているか、あるいは結果として
得られる認識パターンが音声分析ソフトウェアにおいて
設定されている許容値を超えるようなアクセントを含ん
でいる等の結果として起こる。もしくは、ユーザが、装
置によって認識されるようにセットアップされていない
コマンドに対する語を使用している場合がある。いずれ
の場合も、ユーザは、適切な音声処置コマンドを作成す
るよう再度試みることとなる。

【００１５】有効な認識パターンは、コマンド数値また
はコマンドテキストに翻訳され、例えばポータブルスキ
ャナ内のメモリの音声コマンド注釈ファイルに格納され
る。そこでは、音声コマンド注釈ファイルは、ドキュメ
ントデータファイルに関連付けられている。そして、ド
キュメントデータファイルをホストコンピュータにコピ
ーする時、音声コマンド注釈ファイルもそのドキュメン
トデータファイルと共に自動的にコピーされ、ホストコ
ンピュータ内で実行されるファイル転送ソフトウェアに
よって検出される。このファイル転送ソフトウェアは、
音声コマンド注釈ファイルからコマンド数値またはコマ
ンドテキストを読出した後、そのコマンド数値またはコ
マンドテキストに関連する１以上の命令を実行する。本
発明の他の実施の形態では、音声処置コマンドは装置に
よって取込まれ、ＷＡＶファイル等の業界標準オーディ
オファイルフォーマットで格納される。そして、このＷ
ＡＶファイルは、ドキュメントデータファイルと共にホ
ストコンピュータにコピーされる。その後、ホストコン
ピュータにおいてファイル転送ソフトウェアにより認識
パターンに変換され、ホストコンピュータ内のメモリに
保持されている予め決められた認識パターンのセットと
比較される。なお、この実施の形態によれば、装置内に
必要な計算量が低減されるが、音声コマンドが与えられ
た時にその有効性に関してユーザに即時にフィードバッ
クすることはできない。そして、何らかの理由により、
ＷＡＶファイルから生成される認識パターンがメモリ内
に保持されている予め決められた認識パターンのうちの
いずれとも一致しない場合、ユーザはＷＡＶファイルの
内容を聞いてそのコマンドが何を意図していたのかを判
断し、そのコマンドをマニュアルで実行することができ
る。

【００１６】本発明の異なる実施の形態では、それぞれ
があらゆるレベルの固有の精巧な部分を有している。１
つの実施の形態では、ファイル転送ソフトウェアが「電
子メール」等の音声処置コマンドを処理する時に、ユー
ザがイメージデータファイルまたはドキュメントデータ
ファイルを送信したいと思っている電子メールアドレス
にタイプ入力するよう求めるプロンプトが、ホストコン
ピュータのグラフィクス・ディスプレイに送信され出力
される。そして、ユーザが電子メールアドレスにタイプ
入力してエンターキーを押すと、ファイル転送ソフトウ
ェアはホストコンピュータ内の電子メールユーティリテ
ィにアクセスする。それにより、音声処置コマンドに関
連するドキュメントデータファイルが、ユーザが入力し
たアドレスに電子メールで送信される。音声コマンド注
釈ファイルのすべてのコマンドが実行されると、その音
声コマンド注釈ファイルは正常に削除される。

【００１７】本発明の他の実施の形態では、「ビル・ジ
ョーンズにファックス」等の音声処置コマンドが、ホス
トコンピュータにおいてファイル転送ソフトウェアおよ
び音声分析ソフトウェアによって処理され、関連するイ
メージデータファイルまたはドキュメントデータファイ
ルをビル・ジョーンズにファックス送信することを意味
すると解釈される。ファイル転送ソフトウェアは、名前
およびファックス番号を含むホストコンピュータ内の適
当なデータベースからビル・ジョーンズを探索し、ビル・
ジョーンズのファックス番号を検索する。そして、ファ
イル転送ソフトウェアは、ホストコンピュータ内のファ
ックスユーティリティにアクセスする。これによって、
データベースから検索したファックス番号を用いて、音
声コマンド注釈ファイルに関連するイメージデータファ
イルまたはドキュメントデータファイルが、ビル・ジョ
ーンズにファックス送信される。音声コマンド注釈ファ
イルのすべてのコマンドが実行されると、その音声コマ
ンド注釈ファイルは正常に削除される。

【００１８】本発明の更に他の実施の形態では、「４１
８７５３４にファックス」等の音声処置コマンドが、ホ
ストコンピュータにおいてファイル転送ソフトウェアお
よび音声分析ソフトウェアによって処理され、関連する
ドキュメントデータファイルをファックス電話番号４１
８−７５３４にファックス送信することを意味すると解
釈される。そして、ファイル転送ソフトウェアは、ホス
トコンピュータ内のファックスユーティリティにアクセ
スする。それによって、音声コマンド注釈ファイルに関
連するドキュメントデータファイルが、４１８−７５３
４にファックス送信される。音声コマンド注釈ファイル
のすべてのコマンドが実行されると、その音声コマンド
注釈ファイルは正常に削除される。

【００１９】本発明の更に他の実施の形態では、音声分
析ソフトウェアにより、ユーザの音声入力したコマンド
を認識するように装置がトレーニングされる。この音声
分析ソフトウェアは、装置内に配置されているか、また
は、ホストコンピュータシステムに配置されて、装置が
ホストコンピュータシステムにつながれている（tether
ed）時にアクセスされるようになっている。本発明の好
ましい実施の形態では、つなぎモード（tethered mod
e）を使用することにより、ホストコンピュータシステ
ムで使用可能なより大きい演算能力を利用し、装置内で
必要な計算量を低減する。

【００２０】例えば、ユーザは、トレーニングモードに
おいて音声分析ソフトウェアを使用して、音声処置コマ
ンドによりファイル転送ソフトウェアが実行することの
できる予め決められた機能のリストにアクセスする。例
えば、コマンド１は、イメージデータファイルまたはド
キュメントデータファイルの印刷機能を実行するための
命令のセットを表している。トレーニングおよび分析の
ためにコマンド１を選択した場合、ユーザは、音声分析
ソフトウェアによって、ユーザがコマンド１の印刷機能
用の命令のセットを呼出すために使用したい語を選択す
るよう要求される。そして、ユーザは、その選択した語
を何回か繰返すよう要求される。論理的な選択としては
「印刷」という語が選択されるものであるが、ユーザが
選択し機能についてまだ使用していない任意の語を用い
ることも可能である。そして、「印刷」という語が繰返
されるたびにそれが装置によってピックアップされ、音
声分析ソフトウェアによって分析されることにより、認
識パターンが、印刷コマンドとして「印刷」という語を
音声入力するユーザの音声の変化および抑揚を包含する
ようになる。このようにしてあらゆる機能を起動するた
めにユーザが選択したすべての語の認識パターンは、ホ
ストコンピュータのメモリ内の機能認識テーブルに格納
される。この機能認識テーブル内の認識パターンは、あ
らゆる機能についての予め決められた命令のセットにリ
ンクされているコマンド数値またはコマンドテキストを
有しており、それらもまた、ホストコンピュータ内のメ
モリに格納されている。このように、音声入力された音
声処置コマンド語がファイル転送ソフトウェアによって
認識された時、その認識パターンに関連するコマンド数
値またはコマンドテキストを用いて、そのコマンド数値
またはコマンドテキストによって表される機能に対する
命令のセットにアクセスされる。この実施の形態によれ
ば、音声処置コマンド語として外国語を使用することも
可能である。それは、機能に対する命令のセットが、コ
マンド数値またはコマンドテキスト、ユーザが選択した
語、およびその選択した語に続くトレーニングおよび音
声分析に結び付けられているためである。

【００２１】本発明の他の実施の形態では、トレーニン
グおよび音声分析のためにユーザに語の選択が与えられ
ない。機能認識テーブルの認識パターンは予め決められ
ており、ユーザが使用しなければならない特定のコマン
ド語に結び付けられている。例えば印刷の場合、装置
が、ユーザが音声入力したようにコマンド語を認識して
印刷コマンドに関連する命令のセットを呼出すまで、ユ
ーザは「印刷」というコマンド語の発音を修正しなけれ
ばならない。このため、本実施の形態では、装置に対
し、コマンド語がその結果の動作を暗示するかまたは直
感的に示している特定の言語が最初に指定されている。
結果として得られる動作を暗示するかまたは直感的に示
す外国語の語を使用するユーザに対して、装置の外国語
版を用意することができる。

【００２２】本装置は、コントローラによって制御され
る音声オーディオ入力／出力システムを有している。コ
ントローラは、音声処置コマンドを受信すると、そのデ
ジタル化した音声入力をダイナミック・メモリに保存す
る。そして、そのコマンドを処理して、その音声処置コ
マンドの認識パターンをスタティック・メモリに保持さ
れた機能認識テーブルに格納されている認識パターンと
比較する。それらに一致が見つかった場合、認識パター
ンのコマンド数値またはコマンドテキストは、スタティ
ック・メモリ内の音声コマンド注釈ファイルに格納され
る。あるいは、装置内で比較ステップが実行されない場
合、コントローラは、ＷＡＶファイル等のオーディオフ
ァイルフォーマットで音声処置コマンドの音声入力を格
納する。それにより、そのＷＡＶファイルが、その関連
するイメージデータファイルまたはドキュメントデータ
ファイルと共にホストコンピュータにコピーされる。

【００２３】音声注釈は、取込まれたデータの処置を決
定するという問題に対してある程度の解決法ではある。
イメージまたはドキュメントが取込まれた時、音声記述
はオーディオファイルフォーマットで取込まれ、音声注
釈ファイルに格納され、イメージデータファイルまたは
ドキュメントデータファイルと関連付けられる。ユーザ
は、そのドキュメントまたはイメージが何であるかおよ
びその所望の処置を指示する。しかしながら、そのよう
に注釈されたイメージデータファイルまたはドキュメン
トデータファイルの各々は、ホストコンピュータにコピ
ーされ、添付の音声注釈ファイルが有効でない場合に、
ユーザかまたはユーザを補助する他の人によってその内
容が再生して聞かれた後に、処理する必要がある。

【００２４】取込んだドキュメントおよびイメージの音
声注釈を可能とする装置として、本発明の装置は、音声
処置コマンドを音声注釈とは区別する。音声制御コマン
ドを受取って装置の動作を制御することができる装置で
は、ある音声制御コマンドを使用して、装置が音声注釈
用の音声入力を受取ることができ、別の音声制御コマン
ドを使用して、装置が音声処置コマンド用の音声入力を
受取ることができる。本発明の他の実施の形態では、テ
ープレコーダの録音ボタンに似た使用のパラダイムが利
用される。すなわち、装置のあるボタンを押下してその
まま押え続けると、続く音声入力が音声処置コマンドを
目的とするものであって音声注釈または音声制御コマン
ドを目的とするものではない、ということを意味するこ
ととなる。また、装置の他のボタンを押下してそのまま
押え続けると、続く音声入力が音声注釈を目的とするも
のであって音声処置コマンドまたは音声制御コマンドを
目的とするものではない、ということを意味することと
なる。いずれかのボタンを使用して音声入力が終了する
とユーザはボタンを解除する。そして、取込まれた音声
入力は、いずれのボタンが押下されたかに従って、装置
によって処理され、音声注釈ファイルまたは音声コマン
ド注釈ファイルとして現イメージデータファイルまたは
ドキュメントデータファイルに関連付けられる。

【００２５】本発明の上述したおよび他の態様、特徴お
よび利点について、添付している図面と共に示す本発明
についての以下のより詳細な記述を読むことによって、
より理解されるであろう。

【００２６】

【発明の実施の形態】以下の説明は、本発明を実行する
目下考えられる最良態様を説明するものである。この説
明は、限定的な意味で捉えられるべきものではなく、単
に本発明の一般的原理を説明することを目的とするもの
である。本発明の範囲は、添付の特許請求の範囲を参照
することによって判断されるべきである。

【００２７】図１は、本発明の装置のブロック図を示し
ている。同図において、装置１００は、装置１００上の
いくつかの制御ボタン１２０の１つである電源ボタンを
押下することにより、電源が投入される。装置１００
は、内部電池（図１に図示せず）から、もしくは、装置
１００に接続されると共に電源（図１に図示せず）にプ
ラグ接続された電力ケーブルを介して、電力が供給され
る。また、装置１００は、音声コマンドによって電源が
投入されるようにしてもよい。

【００２８】ユーザは、装置１００を、イメージピック
アップ・コンポーネント１１２がイメージまたはドキュ
メントを取込むように動作させる。ポータブル・ハンド
ヘルド・ドキュメントスキャナの場合、ユーザは、イメ
ージピックアップ・コンポーネント１１２が走査対象の
ドキュメントの表面の一部またはすべてに接触するよう
に、スキャナを移動させる。イメージピックアップ・コ
ンポーネント１１２は、ドキュメントの表面から光学的
に標本点を読取り、標本化された各点についてグレイス
ケール値を生成する。コントローラ１０６は、それら標
本点のグレイスケール値を受取り、それらをアセンブル
してイメージアレイにする。その結果は、コントローラ
１０６に接続されたディスプレイ１１４に出力され、走
査されたドキュメントの表面の視覚的表現が表示され
る。また、コントローラ１０６は、表示または格納する
ためにグレイスケール値をバイナリ形式に変換してもよ
い。イメージアレイは、グレイスケールまたはバイナリ
形式のいずれであっても、コントローラ１０６から渡さ
れてドキュメントデータファイルとしてスタティック・
メモリ１１６に格納される。当業者には、上述したこと
が、標本点に対しＲＧＢ値を利用してカラーイメージを
取込むことができる装置に対しても適用することができ
るということが認められるであろう。

【００２９】ポータブル・ハンドヘルド・デジタルカメラ
の場合、ユーザは、デジタルカメラを所望の対象または
シーンに向け、制御ボタン１２０の１つを押下して、そ
の対象またはシーンから反射してイメージピックアップ
・コンポーネント１１２に投射される光を取込んで記録
させる。コントローラ１０６は、ピクチャイメージを固
定数の画素に細分化し、各画素の光の強度をテストし、
その強度を数値に変換する。カラーデジタルカメラの場
合、各画素における赤、緑および青の量を表す３つの数
値が生成される。それら画素はアセンブルされてイメー
ジアレイとなり、スキャナの場合と同様に、その結果を
ディスプレイ１１４に出力して対象またはシーンの視覚
的表現を表示することができる。このイメージアレイ
は、モノクロまたはカラーのいずれの場合でも、コント
ローラ１０６から渡されてイメージデータファイルとし
てスタティック・メモリ１１６に格納される。

【００３０】一方、ユーザが音声ピックアップ・コンポ
ーネント１０２に近づいて音声入力することにより、ド
キュメントデータファイルまたはイメージデータファイ
ルのいずれかについての音声処置コマンドが与えられ
る。音声ピックアップ・コンポーネント１０２は、ユー
ザの音声入力をアナログ信号に変換する。また、音声ピ
ックアップ・コンポーネント１０２にはアナログデジタ
ル変換器１０４が接続されており、このアナログデジタ
ル変換器１０４は、音声ピックアップ・コンポーネント
１０２が生成するアナログ信号をデジタル信号に変換す
る。このデジタル信号は、アナログデジタル変換器１０
４によってコントローラ１０６に送信され、そこでダイ
ナミック・メモリ１１８に格納される。そして、本発明
の好ましい実施の形態では、コントローラ１０６は、ス
タティック・メモリ１１６に格納されている音声分析ソ
フトウェア１２４にアクセスする。音声分析ソフトウェ
ア１２４は、ダイナミック・メモリ１１８に格納された
デジタル信号について一連の周波数領域変換を実行し、
スペクトル変換である認識パターンを生成する。当業者
には、本発明において、スペクトル変換の代りに音声パ
ターンを認識する他の任意の適した方法を使用すること
ができるということが認められるであろう。

【００３１】上記認識パターンは、スタティック・メモ
リ１１６内の機能認識テーブル１２６に格納されている
認識パターン（同様にスペクトル変換）と比較される。
本発明の他の実施の形態では、機能認識テーブル１２６
は装置１００内ではなく、ホストコンピュータシステム
２００内に格納されている。

【００３２】上記比較においていずれかが一致した場
合、コントローラ１０６は、機能認識テーブル１２６内
に見出されダイナミック・メモリ１１８内の一致した認
識パターンに関連付けられたコマンド数値またはコマン
ドテキストを、音声コマンド注釈ファイルに格納する。
いずれも一致していない場合、コントローラ１０６は、
ユーザに対し、入力された音声処置コマンドが有効でな
いことを示す。これは、メッセージを送信してディスプ
レイ１１４に出力することによって行うことができる。
あるいは、警報または言葉からなる可聴メッセージをユ
ーザに出力してもよい。また、デジタルアナログ変換器
１０８は、コントローラ１０６からのデジタル出力信号
をアナログ信号に変換し、スピーカ１１０は、そのアナ
ログ信号をオーディオ出力に変換する。

【００３３】本発明の好ましい実施の形態において、ユ
ーザは、装置１００によってドキュメントを取込んだ
後、音声ピックアップ・コンポーネント１０２に音声入
力して、音声処置コマンド、音声注釈を作成し、または
音声制御コマンドを発行することができる。本発明の１
つの実施の形態では、音声入力に対して上記３つの異な
る目的を区別するために、ユーザは、音声入力する前に
制御ボタン１２０のうちの１つを押下してそのまま押え
続ける。制御ボタン１２０のうちの１つは、音声処置コ
マンドを作成するためのものであり、制御ボタン１２０
のうちの他のものは、音声注釈を作成するためのもので
ある。これら制御ボタン１２０のいずれも押下しない場
合の音声入力は、音声制御コマンド入力として処理され
る。いずれの場合も、制御ボタン１２０のいずれかを押
下すると、ボタンの押下を示す入力がコントローラ１０
６に送信され、続く音声入力のストリームが、いずれの
制御ボタン１２０が押下されたかにより音声処置コマン
ドまたは音声注釈のいずれかであって、音声制御コマン
ド入力ではない、ということが示される。ユーザは、音
声入力し終わった後、押下していた制御ボタン１２０の
うちの１つを解除する。これにより、ボタンの解除を示
す入力がコントローラ１０６に送信され、コントローラ
１０６は、音声処置コマンドまたは音声注釈のいずれか
に対しその音声入力の終端をマークする。取込まれた音
声入力のストリームは、いずれの制御ボタン１２０が押
下されたかにより、音声コマンド注釈ファイルとして、
あるいは音声注釈ファイルとして格納され、取込まれた
イメージデータファイルまたはドキュメントデータファ
イルと関連付けられて、装置１００内のスタティック・
メモリ１１６に格納される。上記のようにイメージデー
タファイルまたはドキュメントデータファイルを、関連
する音声コマンド注釈ファイルまたは音声注釈ファイル
に関連付ける方法の１つは、それらファイルに同じファ
イル名を与えると共に異なるファイルの拡張子を与える
という方法である。従って、１つの音声コマンド注釈フ
ァイルに、１つのイメージデータファイルまたは１つの
ドキュメントデータファイルについて多数の音声処置コ
マンドを格納することができる。あるいは、多数の音声
コマンド注釈ファイルを、１つのイメージデータファイ
ルまたは１つのドキュメントデータファイルに関連付け
ることも可能である。また、制御ボタン１２０の１つと
して、音声制御コマンドを受信するためにユーザが押下
する制御ボタンを設けるようにしてもよい。

【００３４】本発明の他の実施の形態では、音声処置コ
マンドを作成するための音声制御コマンド、および音声
注釈を作成するための音声制御コマンドが使用される。
いずれかの音声制御コマンドを発行した後、続く音声入
力のストリームが取込まれて、音声コマンド注釈ファイ
ルまたは音声注釈ファイルのいずれかとして格納され、
イメージデータファイルまたはドキュメントデータファ
イルに関連付けられる。そして、ユーザが所定の時間
（例えば２〜５秒の間）を超えて音声入力を停止してい
る場合、装置は、そのような音声入力の無い所定の時間
を音声入力のストリームの終端をマークするものと解釈
する。

【００３５】音声ピックアップ・コンポーネント１０２
にある種の音声入力が受信されると、その音声入力は、
アナログ信号に変換される。アナログデジタル変換器１
０４は、音声ピックアップ・コンポーネント１０２が生
成したアナログ信号をデジタル信号に変換し、そのデジ
タル信号をコントローラ１０６に送信する。コントロー
ラ１０６は、そのデジタル信号を音声制御コマンド入力
として処理するか、または、そのデジタル信号を処理し
て、イメージデータファイルまたはドキュメントデータ
ファイルをいずれかの種類の注釈ファイルに関連付け
て、スタティック・メモリ１１６内の音声コマンド注釈
ファイルもしくは音声注釈ファイルに格納する。

【００３６】ユーザは、装置１００が音声コマンド注釈
ファイルまたは音声注釈ファイルの内容を再生するよう
要求することができる。コントローラ１０６は、要求さ
れたいずれかのファイルをスタティック・メモリ１１６
から検索し、それをデジタルアナログ変換器１０８に渡
す。そして、デジタルアナログ変換器１０８は、ファイ
ルに格納されたデジタル信号をアナログ信号に変換す
る。このアナログ信号はスピーカ１１０に渡され、そこ
でオーディオ出力が生成される。更に、あるコマンドに
ついての特定の命令のセットにより、ユーザに対し、そ
のコマンドを受取ったことを、可聴出力を送信すること
によりデジタルアナログ変換器１０８およびスピーカ１
１０を使用して知らせるか、または発光ダイオード（Ｌ
ＥＤ）（図１に図示せず）を点けることによりそのコマ
ンドを知らせることができる。

【００３７】イメージデータファイル、ドキュメントデ
ータファイル、音声注釈ファイルおよび音声コマンド注
釈ファイルは、コントローラ１０６に接続されたホスト
コネクション１２２を介して、ホストコンピュータシス
テム２００（図２）等の他の装置にコピーすることがで
きる。

【００３８】図２は、本発明の装置と通信するホストコ
ンピュータシステムのブロック図を示している。同図に
おいて、ホストコンピュータシステム２００は、演算処
理装置２０２を備えている。演算処理装置２０２は、シ
ステムバス２０４を介してホストコンピュータシステム
２００の他の要素と通信する。キーボード２０６によ
り、ユーザがホストコンピュータシステム２００内に情
報を入力することができ、グラフィクス・ディスプレイ
２１０により、ホストコンピュータシステム２００がユ
ーザに対して情報を出力することができる。また、マウ
ス２０８を用いて情報を入力することもでき、記憶装置
２１２を用いて、ホストコンピュータシステム２００内
にデータおよびプログラムを格納することができる。通
信インタフェース２１４は、同様にシステムバス２０４
に接続されており、装置１００（図１）のホストコネク
ション１２２から情報を受信する。スピーカ／サウンド
カード２１６は、システムバス２０４に接続されてお
り、オーディオ情報をユーザに出力する。なお、ホスト
コンピュータシステムによってはサウンドカードを有し
ていない場合があるが、その場合、スピーカはソフトウ
ェアによってのみ駆動される。メモリ２１８は、同様に
システムバス２０４に接続されており、オペレーティン
グシステム２２０、ファイル転送ソフトウェア２２２、
音声分析ソフトウェア２２４、ユーザインタフェースプ
ログラム２２６、オーディオファイル変換ソフトウェア
２２８および機能認識テーブル２３０を格納している。
本発明の他の実施の形態では、機能認識テーブル２３０
はホストコンピュータシステム２００ではなく、装置１
００に格納されている。

【００３９】ファイル転送ソフトウェア２２２は、ホス
トコネクション１２２（図１）によって装置１００から
コピーされるイメージデータファイル、ドキュメントデ
ータファイル、音声コマンド注釈ファイルおよび音声注
釈ファイルを、通信インタフェース２１４およびシステ
ムバス２０４を介して受信し、それらを記憶装置２１２
に保存する。そして、ファイル転送ソフトウェア２２２
は、記憶装置２１２にコピーされたすべての音声コマン
ド注釈ファイルの処理を開始する。

【００４０】本発明の実施の形態では、音声コマンド注
釈ファイルがＷＡＶフォーマットであるため、ファイル
転送ソフトウェア２２２は、まずその音声コマンド注釈
ファイルを処理して、それに含まれるコマンドの各々に
ついて認識パターンを生成する。ファイル転送ソフトウ
ェア２２２は、音声コマンド注釈ファイルから生成され
た上記認識パターンを、機能認識テーブル２３０に格納
された認識パターンと比較する。その結果いずれかが一
致している場合、ファイル転送ソフトウェア２２２は、
機能認識テーブル２３０内に見出された認識パターンに
ついて、コマンド数値またはコマンドテキストに関連す
る命令のセットの実行を開始する。本発明の実施の形態
では、装置１００が音声処置コマンド入力の音声分析を
実行するため、コピーされた音声コマンド注釈ファイル
からのコマンド数値またはコマンドテキストがファイル
転送ソフトウェア２２２によってアクセスされ、対応す
る命令のセットが実行される。

【００４１】また、ユーザインタフェースプログラム２
２６により、ユーザは、音声注釈ファイルを有するイメ
ージデータファイルまたはドキュメントデータファイル
を選択することができる。オーディオファイル変換ソフ
トウェア２２８は、音声注釈ファイルを、スピーカ／サ
ウンドカード２１６が認識可能なオーディオファイルフ
ォーマットに変換する。スピーカ／サウンドカード２１
６は、オーディオ情報をユーザに出力する。ユーザは、
オーディオ情報を聞いた後、イメージデータファイルま
たはドキュメントデータファイルを表示するよう選択す
ることができる。そのように選択した場合、ユーザイン
タフェースプログラム２２６は一時停止し、そのイメー
ジデータファイルまたはドキュメントデータファイルに
関連付けられたアプリケーションプログラムが呼出さ
れ、イメージデータファイルがグラフィクス・ディスプ
レイ２１０に表示される。

【００４２】本発明の好ましい実施の形態では、ユーザ
が、音声分析ソフトウェア２２４を使用することによ
り、あらゆる言語によるユーザの音声処置コマンドおよ
び音声制御コマンドを認識するよう、装置１００をトレ
ーニングすることができる。まず、装置１００がホスト
コンピュータシステム２００に接続される。そして、ユ
ーザは、音声分析ソフトウェア２２４にアクセスし、ト
レーニングする特定の機能を選択する。この機能は、ユ
ーザがそれを起動するために選択した語によって表され
るべき、特定の機能である。そして、ユーザは、その機
能を起動するために選択した語を何回か繰返す。ユーザ
が選択する可能性の最も高い語は、ユーザが何語で音声
入力するかに関わらず、選択された特定の機能に相当す
るかまたは最も近い語である。ユーザがその機能につい
ての語を繰返すと、その語は、音声ピックアップ・コン
ポーネント１０２（図１）によって取込まれ、装置１０
０によって処理されてデジタル信号となり、ホストコネ
クション１２２を介して通信インタフェース２１４に転
送される。通信インタフェース２１４は、各デジタル信
号をシステムバス２０４を介してメモリ２１８に転送
し、そこで音声分析ソフトウェア２２４が各デジタル信
号を分析する。音声分析ソフトウェア２２４は、各標本
信号の組合せに基づいて、認識パターンを発展させ、機
能を起動するために選択した語を音声入力するユーザの
音声の変化および抑揚を包含するようになる。この処理
は、装置１００によって音声処置コマンドを発行するた
めに使用することができる予め決められた機能の各々に
ついて、繰返される。トレーニングのために選択された
すべての語について確立された認識パターンは、機能認
識テーブル２３０に格納され、一意のコマンド数値また
はコマンドテキストに関連付けられる。本発明の実施の
形態により、音声処置コマンドについての機能認識テー
ブルは、ホストコンピュータシステム２００から装置１
００にダウンロードされてスタティック・メモリ１１６
に格納されるか、またはホストコンピュータシステム２
００に保持される。

【００４３】図３は、装置内で音声処置コマンドに基づ
いて音声分析を実行しない場合の本発明の装置の実施の
形態のフローチャートを示している。同図を参照する
と、ステップ３００において、装置１００（図１）に電
源が投入される。次いで、ステップ３０２において、装
置１００により最初のイメージまたはドキュメントが取
込まれ、イメージデータファイルまたはドキュメントデ
ータファイルとしてスタティック・メモリ１１６（図
１）に格納される。次いで、ステップ３０４において、
ステップ３０２において格納されたイメージデータファ
イルまたはドキュメントデータファイルについて音声処
置コマンドを作成すべきであるという指示が、コントロ
ーラ１０６（図１）に受信されているか否かが判断され
る。そのような指示は、コントローラ１０６が、音声処
置コマンドについて制御ボタン１２０（図１）のうちの
１つからボタンの押下を示す入力を受信することによっ
て作成することができる。あるいは、音声処置コマンド
を作成するために、コントローラ１０６が音声制御コマ
ンド入力を受信することも可能である。ステップ３０４
においてそのような指示が受信されていない場合、制御
はステップ３１４に移る。

【００４４】ステップ３０４において音声処置コマンド
を作成するという指示が受信されている場合、ステップ
３０６において、音声ピックアップ・コンポーネント１
０２（図１）が、音声処置コマンド入力を取込む。次い
で、ステップ３０８において、音声ピックアップ・コン
ポーネント１０２が、音声処置コマンド入力をアナログ
信号としてアナログデジタル変換器１０４に出力する。
次に、ステップ３１０において、アナログデジタル変換
器１０４が、アナログ信号をデジタル信号に変換し、そ
のデジタル信号をコントローラ１０６に出力する。次い
で、ステップ３１２において、コントローラ１０６が、
そのデジタル信号をＷＡＶファイル等のオーディオファ
イルフォーマットでスタティック・メモリ１１６に格納
する。このＷＡＶファイルと、音声注釈コマンドが作成
されたイメージデータファイルまたはドキュメントデー
タファイルとは、互いに関連付けられている。そのよう
に関連付ける方法の１つは、両ファイルに同じファイル
名を与えると共に異なるファイルの拡張子を与えるとい
う方法である。同じイメージデータファイルまたはドキ
ュメントデータファイルが音声注釈ファイルと音声コマ
ンド注釈ファイルの両方を有することができるため、音
声注釈ファイルは、音声コマンド注釈ファイルと異なる
ファイルの拡張子を有するが、３つすべてが同じファイ
ル名を有する。従って、「???????.WAV.ONE」等のよう
にファイルの拡張子に拡張子を付加するか、または「??
?????.WAV1」等のようにファイルの拡張子にパラメータ
を付加することにより、多数の音声コマンド注釈ファイ
ルを１つのイメージデータファイルまたはドキュメント
データファイルに関連付けることができる。

【００４５】次に、ステップ３１４において、別のイメ
ージまたはドキュメントを取込むという指示がコントロ
ーラ１０６に受信されているか否かが判断される。その
ような指示が受信されている場合、制御はステップ３０
２に戻り、次のイメージまたはドキュメントが取込まれ
格納される。一方、ステップ３１４において別のイメー
ジまたはドキュメントを取込むという指示がコントロー
ラ１０６に受信されていない場合、ステップ３１６にお
いて、取込まれたイメージデータファイル、ドキュメン
トデータファイル、音声注釈ファイルおよび音声コマン
ド注釈ファイルが、ホストコネクション１２２（図１）
および通信インタフェース２１４（図２）を利用する確
立されたコネクションを介して、装置１００からホスト
コンピュータシステム２００にコピーされる。このよう
なコネクションは、ワイヤケーブルまたは赤外線等の任
意の適したコネクションによることができる。また、す
べてのファイルをコピーすることも可能であり、あるい
は、ユーザが個々に選択したファイルのみをコピーする
ことも可能である。イメージデータファイルまたはドキ
ュメントデータファイルがコピーされる時はいつでも、
関連する音声注釈ファイルまたは音声コマンド注釈ファ
イルがそのイメージデータファイルまたはドキュメント
データファイルと共に自動的にコピーされる。なお、当
業者は、ユーザがイメージまたはドキュメントを取込み
ながら旅行して帰宅し、その後データをホストコンピュ
ータシステム２００にコピーし始める場合等、ステップ
３１４とステップ３１６との間に相当の時間が経過する
場合があることを認めるであろう。以上のようにファイ
ルをホストコンピュータシステム２００にコピーした
後、装置１００は電源が切られ、その動作が終了する。

【００４６】図４Ａおよび図４Ｂは、図３の装置からコ
ピーされた音声コマンド注釈ファイルに含まれる音声処
置コマンドに基づいて音声分析を実行するホストコンピ
ュータのフローチャートを示している。同図を参照する
と、ステップ４００において、ファイル転送ソフトウェ
ア２２２および音声分析ソフトウェア２２４が、ホスト
コンピュータシステム２００（図２）のメモリ２１８に
ロードされる。次いで、ステップ４０２において、ホス
トコンピュータシステム２００は、図３のステップ３１
６における処理により、イメージデータファイル、ドキ
ュメントデータファイル、音声注釈ファイルおよび音声
コマンド注釈ファイルをメモリ２１８に受信する。そし
て、ファイル転送ソフトウェア２２２が、ステップ４０
２で受信した最初の音声コマンド注釈ファイルの処理を
開始する。次に、ステップ４０６において、音声分析ソ
フトウェア２２４が呼出され、最初の音声コマンド注釈
ファイルに格納された最初のデジタル信号に対して一連
の周波数領域変換が実行され、そのデジタル信号に対す
る認識パターンが生成される。次いで、ステップ４０８
において、ファイル転送ソフトウェア２２２が、ステッ
プ４０６で生成された認識パターンを、メモリ２１８に
格納された機能認識テーブル２３０（図２）内の機能を
表す複数の認識パターンと比較する。次に、ステップ４
１０において、ステップ４０６で生成された認識パター
ンと機能認識テーブル２３０に格納されている認識パタ
ーンのいずれかとが一致しているか否かが判断される。
ここで、有効な音声コマンド注釈について一致したもの
が無い理由には、ユーザの音声入力が速すぎるか、遅す
ぎるか、弱すぎるか、音声ピックアップ・コンポーネン
ト１０２から離れすぎているか、あるいは、結果として
得られる認識パターンが音声分析ソフトウェアにおいて
設定されている許容範囲を超えるようなアクセントを含
んでいるといったことがある。ステップ４１０において
一致したものが見つからなかった場合、ステップ４１２
において図４Ｂの処理が呼出され、ユーザに対し、自動
的に実行されるよう予定されていたステップをマニュア
ルで実行する機会が与えられる。図４Ｂの処理から戻っ
た後、制御はステップ４１６に移る。

【００４７】一方、ステップ４１０において一致したも
のが見つかった場合、ステップ４１４において、機能認
識テーブル２３０に格納された認識パターンに関連す
る、機能認識テーブル２３０に格納されたコマンド数値
またはコマンドテキストを使用して、そのコマンド数値
またはコマンドテキストによって表される機能について
１つの命令または命令のセットにアクセスする。この命
令のセットもまた、機能認識テーブル２３０に格納され
ている。そして、ファイル転送ソフトウェア２２２が、
その命令のセットを実行する。

【００４８】次に、ステップ４１６において、最初の音
声コマンド注釈ファイル内に、更に比較する必要のある
認識パターンがあるか否かが判断される。その判断結果
が「ｙｅｓ」である場合、制御はステップ４０８に戻
り、次の認識パターンが機能認識テーブル２３０の認識
パターンと比較される。一方、ステップ４１６において
比較する認識パターンが無い場合、ステップ４１８にお
いて、更に処理すべき音声コマンド注釈ファイルがある
か否かが判断される。処理すべき音声コマンド注釈ファ
イルがある場合、制御はステップ４０４に戻る。一方、
ステップ４１８において処理すべき音声コマンド注釈フ
ァイルが無い場合、制御はオペレーティングシステム２
２０に戻る。

【００４９】図４Ｂの処理は、図４Ａのステップ４１２
で呼出される。ステップ４２０において、一致するもの
が無いという指示がユーザに対して出力される。この指
示は、グラフィクス・ディスプレイ２１０に出力される
テキストメッセージ、もしくはスピーカ／サウンドカー
ド２１６（図２）に出力されるオーディオメッセージで
もよい。次いで、ステップ４２２において、一致するも
のが無かったオーディオファイルの内容を聞くようユー
ザが選択することができるプロンプトが、ユーザに出力
される。次いで、ステップ４２４において、ユーザによ
るオーディオファイルを再生するという要求を示す入力
が受信されたか否かが判断される。受信されていない場
合、制御は図４Ａのステップ４１６に戻る。一方、ユー
ザから再生を選択したという入力を受信した場合、ステ
ップ４２６において、オーディオファイル変換ソフトウ
ェア２２８が呼出され、ステップ４０４で処理された音
声コマンド注釈ファイルの内容が再生される。

【００５０】音声コマンド注釈ファイルに格納された音
声コマンド注釈を聞いた後、ステップ４２８において、
ステップ４０６で生成された認識パターンが機能認識テ
ーブルに格納されたいずれかの認識パターンに一致した
場合に自動的に実行される操作を、ユーザがマニュアル
で実行するよう選択することができるプロンプトが、ユ
ーザに対して出力される。次いで、ステップ４３０にお
いて、ユーザによる操作をマニュアルで実行するという
要求を示す入力が受信されたか否かが判断される。受信
されていない場合、制御は図４Ａのステップ４１６に戻
る。一方、ユーザから、操作をマニュアルで実行するこ
とを選択したという入力が受信された場合、ステップ４
３２において、ユーザは所望の操作をマニュアルで実行
する。ユーザがそれら操作を実行した後、制御は図４Ａ
のステップ４１６に戻る。

【００５１】例えば、ステップ４２６での再生時に、ユ
ーザが「ビル・ジョーンズにファックス」というオーデ
ィオ出力を聞いたものとする。そして、ユーザがステッ
プ４２８のプロンプトに応じてステップ４３０において
マニュアル操作を実行するよう選択した場合、ステップ
４３２において、ユーザはマニュアルで、ファックスユ
ーティリティにアクセスし、ビル・ジョーンズのファッ
クス番号を入力し、音声コマンド注釈ファイルに関連す
るイメージデータファイルまたはドキュメントデータフ
ァイルをファックス送信する。

【００５２】図５Ａおよび図５Ｂは、装置内で音声処置
コマンドに基づいて音声分析を実行する本発明の装置の
実施の形態のフローチャートを示している。これらの図
を参照すると、ステップ５００において、装置１００
（図１）に電源が投入される。ステップ５０２におい
て、装置１００により最初のイメージまたはドキュメン
トが取込まれ、イメージデータファイルまたはドキュメ
ントデータファイルとしてスタティック・メモリ１１６
（図１）に格納される。次いで、ステップ５０４におい
て、ステップ５０２において格納されたイメージデータ
ファイルまたはドキュメントデータファイルに対し音声
処置コマンドを作成すべきであるという指示がコントロ
ーラ１０６に受信されているか否かが判断される。その
ような指示は、コントローラ１０６が、音声処置コマン
ドについて制御ボタン１２０（図１）のうちの１つから
ボタンの押下を示す入力を受信することによって作成す
ることができる。あるいは、音声処置コマンドを作成す
るために、コントローラ１０６が音声制御コマンドを受
信することも可能である。

【００５３】ステップ５０４においてそのような指示が
受信されていない場合、制御はステップ５２６に移る。
一方、ステップ５０４において音声処置コマンドを作成
するという指示が受信されている場合、ステップ５０６
において、音声ピックアップ・コンポーネント１０２
（図１）が、最初の音声処置コマンド入力を取込む。次
いで、ステップ５０８において、音声ピックアップ・コ
ンポーネント１０２が、音声処置コマンド入力をアナロ
グ信号としてアナログデジタル変換器１０４（図１）に
出力する。次いで、ステップ５１０において、アナログ
デジタル変換器１０４が、アナログ信号をデジタル信号
に変換し、そのデジタル信号をコントローラ１０６に出
力する。

【００５４】次に、ステップ５１２において、コントロ
ーラ１０６が、スタティック・メモリ１１６（図１）内
の音声分析ソフトウェア１２４を呼出して、最初の音声
コマンド注釈ファイルに格納された最初のデジタル信号
に対して一連の周波数領域変換を実行し、そのデジタル
信号について認識パターンを生成する。次いで、ステッ
プ５１４において、そのようにして生成された認識パタ
ーンが、スタティック・メモリ１１６に格納された機能
認識テーブル１２６（図１）内の機能に対する認識パタ
ーンと比較される。次いで、ステップ５１６において、
ステップ５１４で生成された認識パターンと機能認識テ
ーブル１２６に格納された認識パターンのいずれかとが
一致しているか否かが判断される。ステップ５１６で一
致したものが見つからなかった場合、ステップ５１８に
おいて、一致したものが見つからなかったことを示す指
示が、ユーザに音声注釈コマンド入力を繰返すかもしく
はキャンセルするかを要求するプロンプトと共に、ユー
ザに対して出力される。その指示は、ディスプレイ１１
４に出力されるテキストメッセージ、もしくはスピーカ
１１０（図１）に出力されるオーディオメッセージでも
よい。次いで、ステップ５２０において、繰返すかまた
はキャンセルするという指示がコントローラ１０６に受
信されたか否かが判断される。ステップ５２０において
繰返すという指示が受信されている場合、制御はステッ
プ５０６に移り、音声ピックアップ・コンポーネント１
０２により、繰返される音声処置コマンド入力が取込ま
れる。一方、ステップ５２０においてキャンセルすると
いう指示が受信されている場合、制御はステップ５２６
に移る。

【００５５】一方、ステップ５１６において一致したも
のが見つかった場合、ステップ５２２において、機能認
識テーブル１２６内に格納された認識パターンに関連す
る、機能認識テーブル１２６に格納されたコマンド数値
またはコマンドテキストが、音声コマンド注釈ファイル
に格納される。この音声コマンド注釈ファイルは、イメ
ージデータファイルまたはドキュメントデータファイル
に関連付けられている。次いで、ステップ５２４におい
て、ステップ５０２において格納されたイメージデータ
ファイルまたはドキュメントデータファイルについて、
更に音声処置コマンド入力があるか否かが判断される。
その判断結果が「ｙｅｓ」である場合、制御はステップ
５０６に戻り、音声ピックアップ・コンポーネント１０
２により次の音声処置コマンド入力が取込まれる。一
方、ステップ５２４での判断結果が「ｎｏ」である場
合、制御はステップ５２６に移る。

【００５６】ステップ５２６において、装置１００によ
り次のイメージまたはドキュメントを取込むべきである
という指示があるか否かが判断される。その判断結果が
「ｙｅｓ」である場合、制御はステップ５０２に戻り、
装置１００により次のイメージまたはドキュメントが取
込まれ、スタティック・メモリ１１６に格納される。一
方、ステップ５２６における判断結果が「ｎｏ」である
場合、ステップ５２８において、取込まれたイメージデ
ータファイル、ドキュメントデータファイル、音声注釈
ファイルおよび音声コマンド注釈ファイルは、ホストコ
ネクション１２２および通信インタフェース２１４を利
用する確立されたコネクションを介して、装置１００か
らホストコンピュータシステム２００にコピーされる。
なお、当業者は、ユーザがイメージまたはドキュメント
を取込みながら旅行して帰宅し、その後データをホスト
コンピュータシステム２００にコピーし始める場合等、
ステップ５２６とステップ５２８との間に相当の時間が
経過する場合があることを認めるであろう。以上のよう
にファイルをコピーした後、装置１００は電源が切ら
れ、その動作が終了する。

【００５７】図６は、図５Ａおよび図５Ｂの装置により
音声分析が既に実行されている場合における、音声コマ
ンド注釈ファイルを受信するホストコンピュータのフロ
ーチャートを示している。同図を参照すると、ステップ
６００において、ファイル転送ソフトウェア２２２がホ
ストコンピュータシステム２００（図２）のメモリ２１
８にロードされる。次いで、ステップ６０２において、
ホストコンピュータシステム２００は、図５のステップ
５２８における処理により、イメージデータファイル、
ドキュメントデータファイル、音声注釈ファイルおよび
音声コマンド注釈ファイルをメモリ２１８に受信する。
そして、ステップ６０４において、ファイル転送ソフト
ウェア２２２が、ステップ６０２で受信した最初の音声
コマンド注釈ファイルの処理を開始する。次いで、ステ
ップ６０６において、最初の音声コマンド注釈ファイル
内の最初のコマンド数値またはコマンドテキストを使用
して、機能認識テーブル２３０（図２）に格納されてい
るコマンド数値またはコマンドテキストに関連する１つ
の命令または命令のセットにアクセスする。

【００５８】ステップ６０６において１以上の命令が実
行された後、ステップ６０８において、ステップ６０４
において処理された最初の音声コマンド注釈ファイル
に、更にコマンド数値またはコマンドテキストがあるか
否かが判断される。コマンド数値またはコマンドテキス
トがある場合、制御はステップ６０６に戻り、次のコマ
ンド数値またはコマンドテキストに関連した次の命令の
セットにアクセスし実行する。一方、ステップ６０８に
おいてコマンド数値またはコマンドテキストが無い場
合、ステップ６１０において、更に処理すべき音声コマ
ンド注釈ファイルがあるか否かが判断される。その判断
結果が「ｙｅｓ」である場合、制御はステップ６０４に
戻り、次の音声コマンド注釈ファイルが処理される。一
方、ステップ６１０における判断結果が「ｎｏ」である
場合、制御はオペレーティングシステム２２０に戻る。

【００５９】図７は、ユーザの音声処置コマンド入力を
認識するよう本発明の装置をトレーニングするフローチ
ャートを示している。同図を参照すると、ステップ７０
０において、ホストコンピュータシステム２００（図
２）内で音声分析ソフトウェア２２４がメモリ２１８に
ロードされる。次いで、ステップ７０２において、装置
１００（図１）の電源が投入される。次いで、ステップ
７０４において、装置１００が、ホストコンピュータシ
ステム２００に接続される。これは、ワイヤケーブルま
たは赤外線等の任意の適したコネクションによって行う
ことができる。次いで、ステップ７０６において、音声
分析ソフトウェア２２４に、ユーザからの入力が受信さ
れる。この時、ユーザは、トレーニングおよび音声分析
の対象となる最初の機能を、そのコマンド数値またはコ
マンドテキストによって選択する。そして、ステップ７
０８において、音声分析ソフトウェア２２４が、最初の
機能を装置１００の音声ピックアップ・コンポーネント
１０２（図１）内に呼出すためにユーザが選択したコマ
ンド語を、多数回、聞き取れるように繰返すよう、ユー
ザに対して要求する。次いで、ステップ７１０におい
て、音声ピックアップ・コンポーネント１０２によって
取込まれた多数の音声入力が、装置１００によって処理
されてデジタル信号となり、ホストコンピュータシステ
ム２００の音声分析ソフトウェア２２４に送信される。
次いで、ステップ７１２において、音声分析ソフトウェ
ア２２４は、ステップ７１０で受信した多数のデジタル
信号を分析して、コマンド語の認識パターンを作成す
る。次いで、ステップ７１４において、ステップ７１２
で得られた認識パターンがメモリ２１８に格納される。

【００６０】次に、ステップ７１６において、ユーザが
トレーニングおよび音声分析のために次の機能を選択し
たか否か、あるいは、ユーザがトレーニングおよび音声
分析のための機能を選択し終わったという指示を受信し
たか否かが判断される。ステップ７１６において次の機
能が選択されている場合、制御はステップ７０６に移
る。一方、ユーザが機能を選択し終わったという指示を
受信している場合、ステップ７１８において、音声分析
ソフトウェア２２４が、ステップ７１２で判断されステ
ップ７１４で格納されたすべての認識パターン、および
各機能に関連するコマンド数値またはコマンドテキスト
を、ステップ７０４で確立されたコネクションを介して
装置１００に転送する。次いで、ステップ７２０におい
て、ステップ７１８で転送された認識パターンおよびそ
れらに関連するコマンド数値またはコマンドテキスト
が、機能認識テーブル１２６（図１）のスタティック・
メモリ１１６に格納される。ここで、各機能についての
認識パターンおよびコマンド数値またはコマンドテキス
トは、音声制御コマンド入力を受信した時に実行される
命令のセットとリンクされている。この音声制御コマン
ド入力は、処理されて認識パターンとなった時に、ステ
ップ７１２で決定された認識パターンのうちの１つと一
致するものである。そして、ステップ７２０の後、装置
１００のトレーニングおよび音声分析が終了する。

【００６１】本発明の他の実施の形態では、ユーザの音
声処置コマンド入力を認識するための本発明の装置のト
レーニングは、ホストコンピュータにつなげずに行うこ
とができる。これは、スタティック・メモリ１１６に音
声分析ソフトウェア１２４を格納し、ホストコンピュー
タに関連するステップを除き、上記のように概略したス
テップを実行することによって行われる。

【００６２】このように、本発明の目下好ましい実施の
形態について説明してきたが、当業者にとって、構成お
よび回路上の多くの変更および本発明の大きく異なる実
施の形態および使用態様が、特許請求の範囲で定義され
るような本発明の範囲を逸脱しない、ということが理解
されるであろう。ここでの開示および説明は、例を示す
ためのものであり、特許請求の範囲でその範囲が定義さ
れる本発明をいかなる意味においても限定するものでは
ない。

【００６３】以上、本発明の実施例について詳述した
が、以下、本発明の各実施態様の例を示す。

【００６４】[実施態様１]装置（１００）のための音声
コマンド注釈方法であって、(a) 前記装置（１００）に
おいて音声ピックアップ・コンポーネント（１０２）に
より音声処置コマンドを取込むステップ（３０６、５０
６）と、(b) 前記装置（１００）においてコントローラ
（１０６）により前記音声処置コマンドを処理するステ
ップと、(c) 前記コントローラ（１０６）によって処理
した前記音声処置コマンドを音声コマンド注釈ファイル
に格納するステップ（３１２、５２２）と、(d) 前記音
声コマンド注釈ファイルを前記装置（１００）において
データファイルに関連付けるステップ（３１２、５２
２）と、(e) 前記データファイルおよび前記音声コマン
ド注釈ファイルを前記装置（１００）からホストコンピ
ュータシステム（２００）にコピーするステップ（３１
６、５２８）と、(f) 前記ホストコンピュータシステム
（２００）において、前記音声コマンド注釈ファイルを
処理して、前記音声処置コマンドに関連する少なくとも
１つの機能を識別するステップと、(g) 前記少なくとも
１つの機能に関連する少なくとも１つの命令を実行し
（４１４、６０６）、該少なくとも１つの命令は前記デ
ータファイルに基づいて実行する、ステップと、を備え
て成る音声コマンド注釈方法。

【００６５】[実施態様２]ステップ(a)は更に、(a1) 前
記装置（１００）において前記音声ピックアップ・コン
ポーネント（１０２）により複数の追加の音声処置コマ
ンドを取込むステップ（３０６、５０６）を含み、ステ
ップ(b)は更に、(b1) 前記装置（１００）において前記
コントローラ（１０６）により前記複数の追加の音声処
置コマンドを処理するステップを含み、ステップ(c)は
更に、(c1) 前記コントローラ（１０６）によって処理
した前記複数の追加の音声処置コマンドを前記音声コマ
ンド注釈ファイルに格納するステップ（３１２、５２
２）を含み、ステップ(f)は更に、(f1) 前記ホストコン
ピュータシステム（２００）において前記音声コマンド
注釈ファイルを処理して、複数の追加の機能を識別する
ステップであって、該複数の追加の機能各々のうちの１
つは、前記複数の追加の音声処置コマンド各々のうちの
１つと関連付けられている、ステップを含み、ステップ
(g)は更に、(g1) 複数の追加の少なくとも１つの命令を
実行するステップ（４１４、６０６）であって、該複数
の追加の少なくとも１つの命令の各々のうちの１つは、
前記複数の追加の機能の各々のうちの１つと関連付けら
れており、更に、該複数の追加の少なくとも１つの命令
の各々は、前記データファイルに基づいて実行する、ス
テップを含む、ことを特徴とする、実施態様１に記載の
音声コマンド注釈方法。

【００６６】[実施態様３]ステップ(a)は更に、(a1) 前
記装置（１００）において前記音声ピックアップ・コン
ポーネント（１０２）から前記音声処置コマンドをアナ
ログ信号としてアナログデジタル変換器（１０４）に出
力するステップ（３０８）と、(a2) 前記アナログデジ
タル変換器（１０４）において前記アナログ信号をデジ
タル信号に変換するステップ（３１０）と、(a3) 前記
アナログデジタル変換器（１０４）から前記デジタル信
号を前記コントローラ（１０６）に出力するステップ
と、を含み、ステップ(c)は更に、(c1) 前記装置（１０
０）において、前記コントローラ（１０６）により、前
記デジタル信号をスタティック・メモリ（１１６）内の
前記音声コマンド注釈ファイルに格納するステップ（３
１２）であって、該音声コマンド注釈ファイルはオーデ
ィオファイルフォーマットである、ステップを含み、ス
テップ(d)は更に、(d1) 前記データファイルおよび前記
音声コマンド注釈ファイルに同じファイル名を与えると
共に、該データファイルに第１のファイル拡張名を与
え、前記音声コマンド注釈ファイルに第２のファイル拡
張名を与えることにより、該データファイルおよび該音
声コマンド注釈ファイルを関連付けるステップ（３１
２）を含む、ことを特徴とする、実施態様１に記載の音
声コマンド注釈方法。

【００６７】[実施態様４]ステップ(e)は更にステップ
(e)の前に実行される、(e0) 前記ホストコンピュータシ
ステム（２００）において、メモリ（２１８）にファイ
ル転送ソフトウェア（２２２）をロードする（４００）
と共に音声分析ソフトウェア（２２４）をロードするス
テップ（４００）、および、ステップ(e)の後に実行さ
れる、(e1) 前記ホストコンピュータシステム（２０
０）において、前記ファイル転送ソフトウェア（２２
２）により、前記データファイルおよび前記音声コマン
ド注釈ファイルを前記メモリ（２１８）内に受信するス
テップ（４０２）、を備え、ステップ(f)は更に、(f1)
前記音声分析ソフトウェア（２２４）により、前記音声
コマンド注釈ファイル内の前記デジタル信号に対して複
数の周波数領域変換を実行するステップ（４０６）と、
(f2) 前記音声分析ソフトウェア（２２４）により、前
記複数の周波数領域変換から第１の認識パターンを生成
するステップ（４０６）であって、該第１の認識パター
ンは、前記デジタル信号のスペクトル変換である、ステ
ップと、(f3) 前記ホストコンピュータシステム（２０
０）において、前記ファイル転送ソフトウェア（２２
２）により、前記第１の認識パターンを、前記メモリ
（２１８）の機能認識テーブル（２３０）に格納された
前記少なくとも１つの機能についての少なくとも１つの
認識パターンと比較するステップ（４０８）であって、
(f3a) 前記第１の認識パターンが、前記機能認識テーブ
ル（２３０）に格納された前記少なくとも１つの機能に
ついての前記少なくとも１つの認識パターンと一致しな
い場合（４１０）、前記ホストコンピュータシステム
（２００）において、一致したものが見つからなかった
ことを示す第１のメッセージを出力し（４２０）、前記
ホストコンピュータシステム（２００）において、前記
音声コマンド注釈ファイルの内容を聞くための入力を要
求する第２のメッセージを出力し（４２２）、(f3b) ス
テップ(f3a)からの前記聞くための入力が受信された場
合（４２４）、オーディオファイル変換ソフトウェア
（２２８）を呼出して、オーディオ出力のために前記音
声コマンド注釈ファイルを処理し（４２６）、前記ホス
トコンピュータシステム（２００）において、マニュア
ル操作のための入力を要求する第３のメッセージを出力
し（４２８）、(f3c) ステップ(f3b)からの前記マニュ
アル操作のための入力が受信された場合（４３０）、マ
ニュアル操作が実行されるまで当該音声コマンド注釈方
法を一時停止する、ステップと、(f4) 前記第１の認識
パターンが前記機能認識テーブル（２３０）に格納され
た前記少なくとも１つの機能についての前記少なくとも
１つの認識パターンと一致する場合（４１０）、前記フ
ァイル転送ソフトウェア（２２２）により、前記少なく
とも１つの認識パターンに関連するコマンド数値を取り
出すステップと、(f5) 前記ファイル転送ソフトウェア
（２２２）によって、前記コマンド数値により前記少な
くとも１つの命令にアクセスするステップであって、該
少なくとも１つの命令は、前記コマンド数値にリンクし
ている、ステップと、を備えて成ることを特徴とする、
実施態様３に記載の音声コマンド注釈方法。

【００６８】[実施態様５]ステップ(a)は更に、(a1) 前
記装置（１００）において、前記音声ピックアップ・コ
ンポーネント（１０２）から、前記音声処置コマンドを
アナログ信号としてアナログデジタル変換器（１０４）
に出力するステップ（５０８）と、(a2) 前記アナログ
デジタル変換器（１０４）において、前記アナログ信号
をデジタル信号に変換するステップ（５１０）と、(a3)
前記アナログデジタル変換器（１０４）から前記デジ
タル信号を前記コントローラ（１０６）に出力するステ
ップと、(a4) 前記装置（１００）において、前記コン
トローラ（１０６）により、前記デジタル信号をダイナ
ミック・メモリ（１１８）に格納するステップと、を備
え、ステップ(b)は更に、(b1) 前記装置（１００）にお
いて、前記コントローラ（１０６）により、スタティッ
ク・メモリ（１１６）から音声分析ソフトウェア（１２
４）を呼出すステップと、(b2) 前記音声分析ソフトウ
ェア（１２４）により、前記ダイナミック・メモリ（１
１８）の前記デジタル信号に基づいて複数の周波数領域
変換を実行するステップ（５１２）と、(b3) 前記音声
分析ソフトウェア（１２４）により、前記複数の周波数
領域変換から第１の認識パターンを生成するステップ
（５１２）であって、該第１の認識パターンは、前記デ
ジタル信号のスペクトル変換である、ステップと、(b4)
前記装置（１００）において、前記第１の認識パター
ンを、前記スタティック・メモリ（１１６）の機能認識
テーブル（１２６）に格納された前記少なくとも１つの
機能についての少なくとも１つの認識パターンと比較す
るステップ（５１４）であって、(b4a) 前記第１の認識
パターンが、前記機能認識テーブル（１２６）に格納さ
れた前記少なくとも１つの機能についての前記少なくと
も１つの認識パターンと一致しない場合（５１６）、前
記装置（１００）において、一致するものが見つからな
かったことを示す第１のメッセージを出力し（５１
８）、前記装置（１００）において、前記音声処置コマ
ンドを繰返すかまたはキャンセルするための入力を要求
する第２のメッセージを出力する（５１８）、ステップ
と、(b5) 前記第１の認識パターンが、前記機能認識テ
ーブル（１２６）に格納された前記少なくとも１つの機
能についての前記少なくとも１つの認識パターンと一致
する場合（５１６）、前記コントローラ（１０６）によ
り、前記少なくとも１つの認識パターンに関連する、前
記スタティック・メモリ（１１６）に格納されたコマン
ド数値を取り出すステップと、を備え、ステップ(c)は
更に、(c1) 前記コントローラ（１０６）により、前記
装置（１００）における前記スタティック・メモリ（１
１６）の前記音声コマンド注釈ファイルに前記コマンド
数値を格納するステップ（５２２）、を備え、ステップ
(d)は更に、(d1) 前記データファイルおよび前記音声コ
マンド注釈ファイルに同じファイル名を与えると共に、
該データファイルに第１のファイル拡張名を与え、前記
音声コマンド注釈ファイルに第２のファイル拡張名を与
えることにより、前記データファイルおよび前記音声コ
マンド注釈ファイルを関連付けるステップ、を備えて成
ることを特徴とする、実施態様１に記載の音声コマンド
注釈方法。

【００６９】[実施態様６]前記コマンド数値は、コマン
ドテキストである、実施態様４または５に記載の音声コ
マンド注釈方法。

【００７０】[実施態様７]ステップ(e)は更にステップ
(e)の前に実行される、(e0) 前記ホストコンピュータシ
ステム（２００）において、ファイル転送ソフトウェア
（２２２）をメモリ（２１８）にロードするステップ
（６００）、およびステップ(e)の後に実行される、(e
1) 前記ホストコンピュータシステム（２００）におい
て、前記ファイル転送ソフトウェア（２２２）により、
前記データファイルおよび前記音声コマンド注釈ファイ
ルを前記メモリ（２１８）に受信するステップ（６０
２）、を備え、ステップ(f)は更に、(f1) 前記ファイル
転送ソフトウェア（２２２）により、前記音声コマンド
注釈ファイルから前記コマンド数値を取り出すステップ
（６０６）と、(f2) 前記コマンド数値により、前記メ
モリ（２１８）内の前記機能認識テーブル（２３０）に
格納された前記少なくとも１つの命令にアクセスするス
テップであって、該少なくとも１つの命令は、前記コマ
ンド数値にリンクされている、ステップと、を備えて成
る、実施態様５に記載の音声コマンド注釈方法。

【００７１】[実施態様８]ステップ(a)は更にステップ
(a)の前に実行される、(a0a) ホストコンピュータシス
テム（２００）において、音声分析ソフトウェア（２２
４）をメモリ（２１８）にロードするステップ（７０
０）と、(a0b) 前記装置（１００）を前記ホストコンピ
ュータシステム（２００）に接続するステップ（７０
４）と、(a0c) 前記音声分析ソフトウェア（２２４）に
より、予め決められた機能を呼出すための少なくとも１
つの語のトレーニングおよび音声分析のために、前記予
め決められた機能を選択するステップ（７０６）と、(a
0d) 前記装置（１００）の前記音声ピックアップ・コン
ポーネント（１０２）に、前記少なくとも１つの語の複
数の音声入力を取込むステップ（７１０）と、(a0e) 前
記装置（１００）において、前記複数の音声入力を処理
して複数のデジタル信号とするステップ（７１０）と、
(a0f) 前記複数のデジタル信号を前記装置（１００）か
ら前記ホストコンピュータシステム（２００）に送信す
るステップ（７１０）と、(a0g) 前記音声分析ソフトウ
ェア（２２４）により、前記複数のデジタル信号を分析
するステップ（７１２）と、(a0h) 前記音声分析ソフト
ウェア（２２４）により、前記複数のデジタル信号の前
記分析から前記少なくとも１つの認識パターンを作成す
るステップ（７１２）と、(a0i) 前記ホストコンピュー
タシステム（２００）において、前記少なくとも１つの
認識パターンを前記メモリ（２１８）内の前記機能認識
テーブル（２３０）に格納するステップ（７１４）と、
(a0j) 前記ホストコンピュータシステム（２００）にお
いて、前記メモリ（２１８）内の前記機能認識テーブル
（２３０）の前記少なくとも１つの認識パターンを転送
して（７１８）、前記装置（１００）において前記スタ
ティック・メモリ（１１６）内の前記機能認識テーブル
（１２６）に格納するステップであって、前記コマンド
数値は、前記少なくとも１つの認識パターンに関連付け
られている、ステップと、(a0k) 複数の予め決められた
機能について、ステップ(a0c)ないしステップ(a0j)を繰
返すステップ（７１６）であって、複数の前記少なくと
も１つの語についての複数の前記複数の音声入力から、
複数の認識パターンが作成され、さらに、該複数の認識
パターンは、前記装置（１００）において前記スタティ
ック・メモリ（１１６）内の前記機能認識テーブル（１
２６）に格納されており（７２０）、前記複数の認識パ
ターンの各々は、前記スタティック・メモリ（１１６）
内の前記機能認識テーブル（１２６）に格納された複数
のコマンド数値の１つに関連付けられている、ステップ
と、を備えて成ることを特徴とする、実施態様５に記載
の音声コマンド注釈方法。

【００７２】[実施態様９]ステップ(a0a)は新たな、(a0
a) 前記装置（１００）において、前記スタティック・メ
モリ（１１６）内の音声分析ソフトウェア（１２４）に
アクセスするステップ、によって置換えられ、ステップ
(a0b)、ステップ(a0f)、およびステップ(a0i)は削除さ
れ、ステップ(a0j)は新たな、(a0j) 前記装置（１０
０）において、前記少なくとも１つの認識パターンを前
記スタティック・メモリ（１１６）内の前記機能認識テ
ーブル（１２６）に格納するステップであって、前記少
なくとも１つの認識パターンは、該スタティック・メモ
リ（１１６）内の前記機能認識テーブル（１２６）に格
納された前記コマンド数値に関連付けられている、ステ
ップによって置換えられる、ことを特徴とする、実施態
様８に記載の音声コマンド注釈方法。

【００７３】[実施態様１０]ステップ(a)はステップ(a)
の前に実行される、(a0) 前記装置（１００）上の注釈
制御ボタン（１２０）から前記コントローラ（１０６）
にボタン押下入力を受信するステップであって、該装置
（１００）は、前記音声ピックアップ・コンポーネント
（１０２）により前記音声処置コマンドを取込むことが
できるステップ、を更に備え、ステップ(b)は、(b1) 前
記装置（１００）上の前記注釈制御ボタン（１２０）か
ら前記コントローラ（１０６）にボタン解除入力を受信
するステップであって、該装置（１００）は、前記音声
ピックアップ・コンポーネント（１０２）により前記音
声処置コマンドを取込むことができない、ステップを更
に備えて成ることを特徴とする、実施態様１に記載の音
声コマンド注釈方法。

【００７４】

【発明の効果】以上説明したように、本発明を用いるこ
とにより、取込んだイメージまたはドキュメントに注釈
を、その取込み時に付けることができる。

【図面の簡単な説明】

【図１】本発明の装置のブロック図である。

【図２】本発明の装置と通信するホストコンピュータシ
ステムのブロック図である。

【図３】装置内で音声処置コマンドに基づいて音声分析
を実行しない、本発明の装置の実施の形態のフローチャ
ートである。

【図４Ａ】図３の装置からコピーされた音声コマンド注
釈ファイルに含まれる音声処置コマンドに基づいて音声
分析を実行するホストコンピュータのフローチャートで
ある。

【図４Ｂ】図３の装置からコピーされた音声コマンド注
釈ファイルに含まれる音声処置コマンドに基づいて音声
分析を実行するホストコンピュータのフローチャートで
ある。

【図５Ａ】装置内で音声処置コマンドに基づいて音声分
析を実行する、本発明の装置の実施の形態のフローチャ
ートである。

【図５Ｂ】装置内で音声処置コマンドに基づいて音声分
析を実行する、本発明の装置の実施の形態のフローチャ
ートである。

【図６】図５Ａおよび図５Ｂの装置によって音声分析が
既に実行されている場合の、音声コマンド注釈ファイル
を受信するホストコンピュータのフローチャートであ
る。

【図７】ユーザの音声処置コマンド入力を認識するよう
本発明の装置をトレーニングするフローチャートであ
る。

【符号の説明】

１００：装置１０２：音声ピックアップ・コンポーネント１０４：アナログデジタル変換器１０６：コントローラ１１６：スタティック・メモリ１１８：ダイナミック・メモリ１２０：制御ボタン１２４：音声分析ソフトウェア１２６：機能認識テーブル２００：ホストコンピュータシステム２１８：メモリ２２２：ファイル転送ソフトウェア２２４：音声分析ソフトウェア２２８：オーディオファイル変換ソフトウェア２３０：機能認識テーブル

Claims

【特許請求の範囲】

【請求項１】装置のための音声コマンド注釈方法であっ
て、(a) 前記装置において音声ピックアップ・コンポー
ネントにより音声処置コマンドを取込むステップと、
(b) 前記装置においてコントローラにより前記音声処置
コマンドを処理するステップと、(c) 前記コントローラ
によって処理した前記音声処置コマンドを音声コマンド
注釈ファイルに格納するステップと、(d) 前記音声コマ
ンド注釈ファイルを前記装置においてデータファイルに
関連付けるステップと、(e) 前記データファイルおよび
前記音声コマンド注釈ファイルを前記装置からホストコ
ンピュータシステムにコピーするステップと、(f) 前記
ホストコンピュータシステムにおいて、前記音声コマン
ド注釈ファイルを処理して、前記音声処置コマンドに関
連する少なくとも１つの機能を識別するステップと、
(g) 前記少なくとも１つの機能に関連する少なくとも１
つの命令を実行し、該少なくとも１つの命令は前記デー
タファイルに基づいて実行する、ステップと、を備えて
成る音声コマンド注釈方法。