JP2013235570A

JP2013235570A - 機密情報の音声入力のための方法、コンピュータ・プログラム、およびシステム

Info

Publication number: JP2013235570A
Application number: JP2013079060A
Authority: JP
Inventors: John Kuragan Brian; ブライアン・ジョン・クラガン; Kevin Johlic Marc; マーク・ケヴィン・ジョリク
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2012-05-03
Filing date: 2013-04-05
Publication date: 2013-11-21
Anticipated expiration: 2033-04-05
Also published as: CN103383638B; US20130297316A1; JP6202858B2; CN103383638A; DE102013206979A1; US8903726B2

Abstract

【課題】情報の音声入力のための方法、システム、およびコンピュータ・プログラム製品が、例示的実施形態に提供される。
【解決手段】音声入力に対して変換規則が適用される。エントリ・フィールド入力が生成され、この変換規則により、音声入力とエントリ・フィールド入力とを区別することが可能であり、音声入力はエントリ・フィールド入力を難読化する。アプリケーションにエントリ・フィールド入力が提供され、エントリ・フィールドはアプリケーション内にデータ・エントリ・フィールドを読み込む際に有用である。
【選択図】図３

Description

本発明は一般に、データ入力のための方法、システム、およびコンピュータ・プログラム製品に関する。より具体的に言えば、本発明は、機密情報の音声入力のための方法、システム、およびコンピュータ・プログラム製品に関する。

様々なコンピューティング・デバイスまたはデータ処理システム上で実行する多くのアプリケーションは、ユーザ入力を必要とする。しばしばユーザ入力とは、そのユーザ入力を受信するように指定されたデータ・エントリ・フィールド（entry field）（エントリ・フィールド）へのデータ入力である。

エントリ・フィールドは、ユーザ入力を受け入れることが可能なフォーム、文書、データベース、または任意の他のアプリケーション内のエントリ・フィールドとすることができる。こうしたアプリケーションを実行するデータ処理システムは、一般に入手可能なコンピュータ、リモート端末、またはポータブル・デバイスとすることが可能である。たとえばコンピュータは、スプレッドシート・セルすなわちエントリ・フィールド内で、データすなわちユーザ入力を受け入れることが可能な、スプレッドシート・アプリケーションを実行することができる。他の例として、スマートフォンは、パスワード・フィールドすなわちエントリ・フィールド内で、パスワードすなわちユーザ入力を受け入れるアプリケーションを実行することができる。

ユーザは、様々な方法で入力を提供することができる。たとえばユーザは、キーボードを使用してエントリ・フィールド内にテキストをタイプすることができる。他の例として、ユーザは、データ処理システムに関連付けられたマイクロフォンに向かって発話することで、音声で入力することが可能であり、これがテキストに変換され、エントリ・フィールドに挿入される。他の例としてユーザは、ポインティング・デバイスを用いるかまたは用いることなく、データ処理システムに関してジェスチャすることが可能であり、このジェスチャがユーザ入力として解釈される。その後ジェスチャは、エントリ・フィールド内へのデータ入力のためのテキストに変換される。

例示的実施形態は、情報の音声入力のための方法、システム、およびコンピュータ・プログラム製品を提供する。

ある実施形態は、プロセッサおよびメモリを使用して音声入力に対して変換規則を適用する。この実施形態はエントリ・フィールド入力を生成する。この変換規則は、音声入力をエントリ・フィールド入力とは区別されるものとすることを可能とし、音声入力はエントリ・フィールド入力を難読化する（obfuscate）。実施形態はアプリケーションにエントリ・フィールド入力を提供し、エントリ・フィールド入力はアプリケーション内のデータ・エントリ・フィールドに読み込むために使用される。

本発明の特徴と考えられる新規な特徴は、添付の特許請求の範囲に記載されている。しかしながら、本発明自体、ならびに好ましい使用方法、さらにその目的および利点は、例示的実施形態についての以下の詳細な説明を添付の図面と共に参照することによって、最も良く理解されるであろう。

例示的実施形態を内部に実装可能なデータ処理システムのネットワークを示す図表現である。例示的実施形態を内部に実装可能なデータ処理システムを示すブロック図である。例示的実施形態に従った機密情報の音声入力例を示すブロック図である。例示的実施形態に従った音声入力アプリケーションの構成例を示すブロック図である。例示的実施形態に従った音声入力アプリケーションにおける変換例を示すプロセス流れ図である。例示的実施形態に従った機密情報の音声入力のプロセス例を示す流れ図である。

本明細書に記載された例示的実施形態との関連において、ユーザからの音声入力を受け入れるデータ処理システムは、マイクロフォンなどの音声捕捉デバイスを用いて構成されるものと想定される。音声入力とは、実施形態を使用して最終的にテキストに変換可能な音声パターンである。音声入力を実行する動作は、音声入力がデータ処理システムに提供される様式である。特に指定されていない限り、音声入力は人間が生成する音声パターン、機械が生成する音声パターン、人間の可聴範囲内の音声、極超短波または超低周波の音声、あるいはそれらの組み合わせを含むことができる。

例示的実施形態は、アイズフリーあるいはハンズフリーまたはその両方のデータ入力方法を使用する傾向が増えていることを認識している。音声入力は、ユーザが声、音、または発話を使用してデータ入力を提供することができる、アイズフリーおよびハンズフリー・ソリューションである。さらに例示的実施形態は、音声入力方法を使用して入力される何らかのデータがセキュリティに敏感な可能性があることを認識している。たとえば、携帯電話などのデータ処理システムに向かってパスワードを発話するユーザは、立ち聞きされることを避けたい可能性がある。患者の医療情報を音声で入力する医師は、音声入力の便利さを望むが、その情報を他人に聞かれるリスクについても懸念する可能性がある。

個人情報、データ・セキュリティ情報、認証情報、医療情報、および多くの他のカテゴリの情報は、広く機密情報とみなされる。しかしながら例示的実施形態は、その情報、または一般的に機密情報とみなされるデータに限定されることは意図されない。たとえば人の年齢に関する情報はその人にとっての機密情報であるが、他の人にとってはそうではない可能性がある。一般に、例示的実施形態の範囲内では、その入力が実施形態から恩恵を受けることのできる任意の情報を機密情報とみなすことができる。

例示的実施形態は、ポータブル・デバイスを含むがこれに限定されないデータ処理システム上での機密情報の音声入力に対処することが、音声入力の入力者（provider）に近接する他の人物またはデバイスによる意図的な盗聴または不可避の立ち聞きのリスクがあるために問題であることを認識している。障害のある人は特に、周囲に居る人物を検出できない可能性があるため、自分をプライベートな状況に引き離すことができない可能性があるため、および、彼らにとって音声入力が入力手段として唯一開かれたモダリティ（modality）である可能性があるため、こうした音声観察に対して脆弱である。

本発明を説明するために使用される例示的実施形態は、一般に、前述の問題および音声入力の実行に関する他の問題に対処し、解決する。例示的実施形態は、機密情報の音声入力のための方法、システム、およびコンピュータ・プログラム製品を提供する。

例示的実施形態は、ある入力および変換に関して単なる例として説明される。こうした説明は、本発明に限定されることは意図されていない。たとえば、所定のインデックスで文字を選択することによる音声入力の変換に関して説明される例示的実施形態は、制限なしに音声入力を変換する他の様式に関して実装可能である。

例示的実施形態は、あるデータ、データ構造、ファイル・システム、ファイル名、ディレクトリ、および経路（path）に関して、単なる例として説明される。こうした説明は、本発明に限定されることは意図されていない。たとえば、ローカル・アプリケーション名および経路に関して説明される例示的実施形態は、本発明の範囲内でリモート経路(path)上のアプリケーションとして実装可能である。

さらに例示的実施形態は、任意の種類のデータ、データ・ソース、または、データ・ネットワークを介したデータ・ソースへのアクセスに関して実装可能である。任意のタイプのデータ・ストレージ・デバイスは、本発明の範囲内で、データ処理システムでローカルにまたはデータ・ネットワークを介して、本発明の実施形態にデータを提供することができる。

例示的実施形態は、特定のコード、設計、アーキテクチャ、レイアウト、概略図、およびツールを使用して単なる例として説明され、例示的実施形態に限定するものではない。さらに例示的実施形態は、説明を明瞭にするために単なる例として、特定のソフトウェア、ツール、およびデータ処理環境を使用するいくつかのインスタンスで説明される。例示的実施形態は、他の同等または同様の目的の構造、システム、アプリケーション、またはアーキテクチャと共に使用することができる。例示的実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせで実装可能である。

本開示における例は、単に説明を明瞭にするために使用され、例示的実施形態に限定されるものではない。追加のデータ、動作、アクション、タスク、アクティビティ、および操作は本開示から考案可能であり、例示的実施形態の範囲内で同等に企図される。

本明細書に列挙されるいずれの利点も、例示的実施形態に限定されることは意図されていない。追加または異なる利点は、特定の例示的実施形態によって実現可能である。さらに特定の例示的実施形態は、前述の利点のいくつかまたはすべてを有するか、またはいずれも有さない可能性がある。

図面を参照すると、特に図１および図２を参照すると、これらの図面は、例示的実施形態を内部に実装可能なデータ処理環境の例示的な図である。図１および図２は単なる例であり、異なる実施形態を内部に実装可能な環境に関していかなる制限も主張または示唆することは意図されていない。特定の実装は、以下の説明に基づいて、示された環境に対して多くの修正を行うことができる。

図１は、例示的実施形態を内部に実装可能なデータ処理システムのネットワークを示す図表現である。データ処理環境１００は、例示的実施形態を内部に実装可能なコンピュータのネットワークである。データ処理環境１００はネットワーク１０２を含む。ネットワーク１０２は、データ処理環境１００内で互いに接続された様々なデバイスおよびコンピュータ間に通信リンクを提供するために使用される媒体である。ネットワーク１０２は、有線、無線の通信リンク、または光ファイバ・ケーブルなどの接続を含むことができる。サーバ１０４およびサーバ１０６は、ストレージ・ユニット１０８と共にネットワーク１０２に結合される。ソフトウェア・アプリケーションは、データ処理環境１００内の任意のコンピュータ上で実行可能である。

加えて、クライアント１１０、１１２、および１１４もネットワーク１０２に結合される。サーバ１０４または１０６などのデータ処理システム、あるいはクライアント１１０、１１２、または１１４はデータを含むことが可能であり、その上で実行するソフトウェア・アプリケーションまたはソフトウェア・ツールを有することができる。

デバイス１２０は、ネットワーク１０２に接続されたポータブル・デバイスの例である。サーバ１０４および１０６のいずれか、クライアント１１０、１１２、および１１４のいずれか、または音声入力を受け入れるデバイス１２０には、マイクロフォンなどの音声捕捉デバイス（図示せず）が装備されている。例として、デバイス１２０は、エントリ・フィールド１２２を含むフォームを提示するアプリケーション（図示せず）を含む。ユーザ１２６からの音声１２４は、実施形態に従ってエントリ・フィールド１２２のためのデータに変換される音声入力を形成する。実施形態を実装するアプリケーションはデバイス１２０内で実行する。

サーバ１０４および１０６、ストレージ・ユニット１０８、ならびにクライアント１１０、１１２、および１１４は、有線接続、無線通信プロトコル、または他の好適なデータ接続を使用してネットワーク１０２に結合することができる。クライアント１１０、１１２、および１１４は、たとえばパーソナル・コンピュータまたはネットワーク・コンピュータとすることができる。

示された例では、サーバ１０４はブート・ファイル、オペレーティング・システム・イメージ、およびアプリケーションなどのデータを、クライアント１１０、１１２、および１１４に提供することができる。クライアント１１０、１１２、および１１４は、この例ではサーバ１０４に対するクライアントとすることができる。クライアント１１０、１１２、１１４、またはそれらの何らかの組み合わせは、それら独自のデータ、ブート・ファイル、オペレーティング・システム・イメージ、およびアプリケーションを含むことができる。データ処理環境１００は、図示されていない追加のサーバ、クライアント、および他のデバイスを含むことができる。

示された例では、データ処理環境１００はインターネットとすることができる。ネットワーク１０２は、伝送制御プロトコル／インターネット・プロトコル（ＴＣＰ／ＩＰ）および他のプロトコルを使用して互いに通信する、ネットワークおよびゲートウェイの集合を表すことができる。インターネットの中心には、データおよびメッセージをルーティングする何千という商用、行政用、教育用、および他のコンピュータ・システムを含む、主要ノードまたはホスト・コンピュータ間のデータ通信リンクの基幹がある。もちろん、データ処理環境１００は、たとえばイントラネット、ローカル・エリア・ネットワーク（ＬＡＮ）、またはワイド・エリア・ネットワーク（ＷＡＮ）などの、いくつかの異なるタイプのネットワークとしても実装可能である。図１は例として意図されたものであり、異なる例示的実施形態に対するアーキテクチャ上の制限としては意図されていない。

データ処理環境１００は、他の用途の中でも特に、例示的実施形態を内部に実装可能なクライアント・サーバ環境を実装するために使用することができる。クライアント・サーバ環境は、ネットワーク全体にわたってソフトウェア・アプリケーションおよびデータを分散させ、結果としてクライアント・データ処理システムとサーバ・データ処理システムとの間での対話を使用することでアプリケーションを機能させることができる。データ処理環境１００は、ネットワーク全体にわたって分散された相互運用可能なソフトウェア構成要素をコヒーレントなビジネス・アプリケーションとしてまとめてパッケージングすることができる、サービス指向アーキテクチャを採用することもできる。

図２を参照すると、この図は例示的実施形態を内部に実装可能なデータ処理システムのブロック図を示す。データ処理システム２００は、図１におけるサーバ１０４またはクライアント１１０などのコンピュータの例であり、その内部に例示的実施形態のプロセスを実装するコンピュータ使用可能プログラム・コードまたは命令を例示的実施形態のために配置することができる。

示された例では、データ処理システム２００は、ノース・ブリッジおよびメモリ・コントローラ・ハブ（ＮＢ／ＭＣＨ）２０２ならびにサウス・ブリッジおよび入力／出力（Ｉ／Ｏ）コントローラ・ハブ（ＳＢ／ＩＣＨ）２０４を含むハブ・アーキテクチャを採用する。処理ユニット２０６、メイン・メモリ２０８、およびグラフィクス・プロセッサ２１０は、ノース・ブリッジおよびメモリ・コントローラ・ハブ（ＮＢ／ＭＣＨ）２０２に結合される。処理ユニット２０６は１つまたは複数のプロセッサを含むことが可能であり、１つまたは複数の異種プロセッサ・システムを使用して実装可能である。グラフィクス・プロセッサ２１０は、ある実装においてアクセラレーテッド・グラフィクス・ポート（ＡＧＰ）を介してＮＢ／ＭＣＨに結合可能である。

示された例では、ローカル・エリア・ネットワーク（ＬＡＮ）アダプタ２１２はサウス・ブリッジおよびＩ／Ｏコントローラ・ハブ（ＳＢ／ＩＣＨ）２０４に結合される。オーディオ・アダプタ２１６、キーボードおよびマウス・アダプタ２２０、モデム２２２、読み取り専用メモリ（ＲＯＭ）２２４、ユニバーサル・シリアル・バス（ＵＳＢ）および他のポート２３２、ならびにＰＣＩ／ＰＣＩｅデバイス２３４が、バス２３８を介してサウス・ブリッジおよびＩ／Ｏコントローラ・ハブ２０４に結合される。ハード・ディスク・ドライブ（ＨＤＤ）２２６およびＣＤ−ＲＯＭ２３０は、バス２４０を介してサウス・ブリッジおよびＩ／Ｏコントローラ・ハブ２０４に結合される。ＰＣＩ／ＰＣＩｅデバイスは、たとえばイーサネット・アダプタ、アドイン・カード、およびノートブック・コンピュータ用のＰＣカードを含むことができる。ＰＣＩはカード・バス・コントローラを使用するが、ＰＣＩｅは使用しない。ＲＯＭ２２４は、たとえばフラッシュ・バイナリ入力／出力システム（ＢＩＯＳ）とすることができる。ハード・ディスク・ドライブ２２６およびＣＤ−ＲＯＭ２３０は、たとえば集積ドライブ・エレクトロニクス（ＩＤＥ）またはシリアル拡張技術アタッチメント（ＳＡＴＡ）インターフェースを使用することができる。スーパーＩ／Ｏ（ＳＩＯ）デバイス２３６はサウス・ブリッジおよびＩ／Ｏコントローラ・ハブ（ＳＢ／ＩＣＨ）２０４に結合することができる。

オペレーティング・システムは処理ユニット２０６上で実行する。オペレーティング・システムは、図２のデータ処理システム２００内の様々な構成要素の制御を調整および提供する。オペレーティング・システムは、Microsoft(R)Windows(R)（MicrosoftおよびWindowsは、米国あるいは他の諸国またはその両方におけるMicrosoft Corporationの商標である）、またはLinux(R)（Linuxは、米国あるいは他の諸国またはその両方におけるLinus Torvaldsの商標である）などの市販のオペレーティング・システムとすることができる。Ｊａｖａプログラミング・システムなどのオブジェクト指向プログラミング・システムは、オペレーティング・システムと共に実行可能であり、データ処理システム２００上で実行するＪａｖａプログラムまたはアプリケーションからオペレーティング・システムへの呼び出しを提供する（ＪａｖａおよびすべてのＪａｖａベースの商標およびロゴは、Oracleあるいはその関連会社またはその両方の商標または登録商標である）。

オペレーティング・システム、オブジェクト指向プログラミング・システム、例示的実施形態のプロセス、およびアプリケーションまたはプログラムに関するプログラム命令は、ハード・ディスク・ドライブ２２６などのストレージ・デバイス上に配置され、処理ユニット２０６による実行のために、たとえばメイン・メモリ２０８、読み取り専用メモリ２２４、または１つまたは複数の周辺デバイスなどのメモリにロードすることができる。プログラム命令は不揮発性メモリ内に永続的に格納すること、および、そこからロードすることまたは所定の位置で実行することのいずれかも可能である。たとえば実施形態に従った統合プログラムを不揮発性メモリに格納し、そこからＤＲＡＭにロードすることが可能である。

図１〜図２のハードウェアは、実装に応じて変更可能である。図１〜図２に示されたハードウェアに加えて、またはそれらに代わって、フラッシュ・メモリ、等価の不揮発性メモリ、または光ディスク・デバイスなどの、他の内部ハードウェアまたは周辺デバイスを使用することができる。加えて、例示的実施形態のプロセスをマルチプロセッサ・データ処理システムに適用することもできる。

いくつかの例では、データ処理システム２００は、オペレーティング・システム・ファイルあるいはユーザ生成データまたはその両方を格納するための不揮発性メモリを提供するように、一般にフラッシュ・メモリと共に構成された、携帯情報端末（ＰＤＡ）とすることができる。バス・システムは、システム・バス、Ｉ／Ｏバス、およびＰＣＩバスなどの、１つまたは複数のバスを備えることができる。もちろんバス・システムは、ファブリックまたはアーキテクチャに接続された異なる構成要素またはデバイス間にデータの転送を提供する、任意のタイプの通信ファブリックまたはアーキテクチャを使用して実装することができる。

通信ユニットは、モデムまたはネットワーク・アダプタなどの、データを送信および受信するために使用される１つまたは複数のデバイスを含むことができる。メモリは、たとえばメイン・メモリ２０８、またはノース・ブリッジおよびメモリ・コントローラ・ハブ２０２内に見られるキャッシュなどのキャッシュとすることができる。処理ユニットは、１つまたは複数のプロセッサまたはＣＰＵを含むことができる。

図１〜図２に示された例および前述の例は、アーキテクチャ上の制限を示唆することを意味していない。たとえばデータ処理システム２００は、ＰＤＡの形を取ることに加えて、タブレット・コンピュータ、ラップトップ・コンピュータ、または電話デバイスとすることもできる。

図３を参照すると、この図は、例示的実施形態に従った機密情報の音声入力例のブロック図を示す。データ処理システム３０２は、図１のサーバ１０４および１０６、クライアント１１０、１１２、および１１４、またはデバイス１２０のうちのいずれかと同様である。単なる例として、またそれに対する例示的実施形態のいかなる制限も示唆することなく、データ処理システム３０２は図１のデバイス１２０と同様に示される。

ユーザ３０４は、データ処理システム３０２内のマイクロフォン３０８を介してデータ処理システム３０２に音声入力３０６を提供する。データ処理システム３０２は、実施形態を実装する音声入力アプリケーション３１０を含む。データ処理システム３０２内で実行する他のアプリケーション３１２は、エントリ・フィールド３１４を提示する。エントリ・フィールド３１４にはデータが読み込まれることになる。

例示的実施形態に従って動作する音声入力アプリケーション３１０は、エントリ・フィールド入力３１４内への音声入力３０６をエントリ・フィールド３１６のためのデータ３１８に変換するプロセスを含む。例としてエントリ・フィールド３１６は、ユーザ３０４によって、またはデータ処理システム３０２内のプロセスによって、データ入力のために選択される。音声入力３０６のエントリ・フィールド入力３１６への変換は、１つまたは複数の変換規則によって実行される。変換規則とは、音声入力３０６がエントリ・フィールド入力３１６へと処理される際に従う論理である。

たとえば変換規則の例が、音声入力３０６内のあらゆる単語の２番目の文字を使用してエントリ・フィールド入力３１６が構築されることであるものと想定してみる。たとえばユーザ３０４が音声入力３０６として、「EPILOG CAMERA ASSIGN ESSENTIAL」という句を発話する。他の動作の中でも特に、音声入力アプリケーション３１０はその変換規則を使用して、認識された単語「EPILOG」、「CAMERA」、「ASSIGN」、および「ESSENTIAL」からそれぞれ「Ｐ」、「Ａ」、「Ｓ」、および「Ｓ」の文字が選択されるように、その句の変換を実行する。この文字をまとめて「PASS」を形成し、これがエントリ・フィールド３１４への入力となるデータである。

音声入力アプリケーション３１０は、音声入力の句「EPILOG CAMERA ASSIGN ESSENTIAL」から単語「PASS」を構築する。音声入力アプリケーション３１０は、単語「PASS」のエントリ・フィールド入力３１６をアプリケーション３１２に提供する。アプリケーション３１２はこのデータ「PASS」をエントリ・フィールド３１４に適用する。この例の変換規則を使用して、この例の様式で動作すると、ユーザ３０４が音声入力３０６を発話した場合、実施形態が実際のデータ「PASS」を盗聴または立ち聞きから難読化することができる。

示された例は、音声入力から認識された単語へのオフセットに基づいて、１ステップ変換規則を使用する。同様に実施形態は、任意の好適な変換規則を使用して、所与の音声入力３０６を適切なエントリ・フィールド入力３１６に変換することができる。

たとえば他の変換規則は、２ステップ変換プロセスを含むことができる。ユーザは頭字語を発話することが可能であり、第１の変換ステップはこの頭字語を完全なテキスト形式に変換し、第２の変換ステップはあるオフセットで文字を完全なテキスト単語に識別する。したがってこの２ステップ変換例の動作例では、音声入力として発話された「E.D.I」が結果として「Electronic Data Interchange」となり、これが各単語の最初の２文字を選択することにより、結果として「eldain」となり、「eldain」はエントリ・フィールド入力を形成する。

他の例として、他の変換規則は３ステップ変換プロセスを含むことができる。たとえばユーザは「England」と発話することができる。変換プロセスでの第１のステップは、辞書を使用するなどによって、国の名前が発話されていることを認識する。第２のステップは、データベースを使用するなどによって、その国の首都、すなわち「London」を識別する。第３のステップは、ジオコーディング（geocoding）アプリケーションを使用してその都市の緯度および経度が５１および０であることを特定し、この数字を連結して数字の組み合わせ「５１０」を形成する。したがって実施形態は、ユーザが「５１０」の代わりに「England」と言えるようにすることによって、数字の組み合わせ（５１０）の機密情報を難読化する。

任意の数およびタイプの変換を組み合わせて、音声入力アプリケーション３１０で使用するための変換規則を作成することができる。このように使用可能な変換のさらにいくつかの例は、発話された単語または発話された単語から導出された単語内でのあるインデックス・オフセットでの文字セット、その名前が発話されたかまたは発話された単語から導出された都市の緯度および経度、タイムゾーン、または人口、日付の数字に対応する文字に変換された発話された日付、カスタム辞書を使用して数字に変換された文字および日付を形成する数字、数として使用される単語の長さ、１つまたは複数のリポジトリを使用することによって名前および数を示す名前として認識された単語、発話または導出されたｎ番目の単語のみを使用すること、あるいは、発話または導出されたｎ文字より長い単語のみを考慮することである。

ある実施形態では、ある結果を達成するための制御の単語として、大文字または特殊なキーボード文字などの、キーワードのセットを割り当てることができる。ある実施形態は、キーワードの使用が容易に予測できないように、キーワードのセットを定義する。たとえば重さの単語（たとえば「重い」、「トン」、「ポンド」、または「キロ」）は、結果として記号「＃」が入力されることになる。例示的実施形態の範囲を逸脱することなく、他の方式も同様に使用することができる。

任意数のこれらおよび他の同様に使用可能な変換を組み合わせて、音声入力アプリケーション３１０における変換を形成することができる。さらにある実施形態では、変換の回数、変換の組み合わせ、またはその両方を変更することができる。たとえば一実施形態は、ユーザが存在できる環境に応じて変換のタイプを変更する。たとえばある実施形態は、ユーザが雑音の多い環境に居ることを、マイクロフォン３０８を通じて感知することができる。したがって音声入力アプリケーション３１０は、ユーザがより静かな環境（したがって、恐らくはユーザの近隣に立ち聞きする人が少ない場所）に居る時よりもより複雑な変換を使用するように決定する。

他の実施形態として、ある実施形態は、ユーザが雑音の多い環境に居ることを、マイクロフォン３０８を通じて感知することができる。したがって音声入力アプリケーション３１０は、ユーザがより静かな環境に居る時よりも複雑でない変換で、より短い単語を使用できるように決定する（恐らくは、雑音の多い区域では静かな区域よりも音声認識が困難であるため）。その逆に、複雑な単語は、その固有の音質によってしばしば容易に認識されるため、ある実施形態の音声入力アプリケーション３１０は、ユーザが雑音の多い環境内でそうした音質を備える特に指定された単語を使用できるようにする。

ある実施形態は、音声入力アプリケーション３１０が異なるユーザに対して異なる変換を使用するように、ユーザ特有の変換プロセスを作成することができる。ある実施形態は、発話された単語または導出された単語から認識される場合、単語を表示することもできる。ある実施形態は、発話された単語または導出された単語から認識される場合、単語を読み返すことも可能である。ある実施形態は、ユーザが認識された単語を拒否し、音声入力を再試行できるようにすることも可能である。

ある実施形態は、ある単語の使用を完全に禁止することもできる。ある実施形態は、単語を所定の回数の音声入力後にのみ音声入力で再使用できるようにすることなどによって、単語の頻繁な再使用を禁止することができる。ある実施形態は、同じ音声入力における単語の反復を禁止することができる。ある実施形態は、ある単語の代替形式を許可または禁止することができる。ある実施形態は、「Ｑ」または「Ｘ」などの稀な文字を備えた単語に対して、こうした規則を緩和することができる。ある実施形態は、異なるエントリ・フィールドに対して、異なる変換規則またはそれらの組み合わせを使用することができる。

本明細書で説明される変換および追加の機能は単なる例示的なものであって、実施形態を限定するものではない。当業者であれば、この開示から多くの他の変換および変換プロセスの修正を想起することが可能であり、例示的実施形態の範囲内で同様に企図される。

図４を参照すると、この図は例示的実施形態に従った音声入力アプリケーションの構成例を示すブロック図である。音声入力アプリケーション４００は図３の音声入力アプリケーション３１０として使用することができる。

示された構成は、音声入力アプリケーション４００の様々な機能構成要素を実装する、単なる例示的様式である。当業者であれば、そこから同様の機能を達成するために、異なる方法で音声入力アプリケーション４００を実装することが可能であり、それらの代替構成は、例示的実施形態の範囲内で企図される。

示された構成例によれば、音声入力アプリケーション４００は音声入力４０２を受信する。音声入力アプリケーション４００は、ユーザまたはシステムによって提供される音声入力を受信する４０２ための構成要素４０４を含む。構成要素４０６は受信した音声入力を処理する。構成要素４０８は処理された音声入力を変換する。構成要素４１０は処理された音声入力から構築されたエントリ・フィールド入力を送信する。エントリ・フィールド入力４１２は音声入力アプリケーション４００によって生成される出力であり、他のアプリケーション内にエントリ・フィールドを読み込むために使用可能である。

音声入力アプリケーション４００内に様々な構成要素が示されているが、ある実装では、例示的実施形態の範囲を逸脱することなく、音声入力アプリケーション４００の外部に構成要素の機能を実装することができる。たとえば一実施形態では、構成要素４０６、４０８、またはそれらの組み合わせは、ウェブ・サービスの形などのように、音声入力アプリケーション４００の外部に実装される。

構成要素４０６などで受信した音声入力の処理は、一般にユーザおよびユーザ入力に関し、特に音声入力に関する他の動作を含むことができる。たとえば一実施形態では、構成要素４０６は認証および許可機能（まとめて許可機能）４１４を実装し、これを、音声入力４０２を提供するユーザまたはシステムがその実行を許可されるかどうか、音声入力４０２が許可されたユーザからのものであるかどうか、音声入力４０２が許可された様式で提供されているかどうか、またはそれらの組み合わせを決定するために使用することができる。他の実施形態では、構成要素４０６は音声入力アプリケーション４００の外部のサービスまたはアプリケーションによって提供可能な許可機能４１４を呼び出す。

一実施形態では、構成要素４０６は音声テキスト変換などの知られた音声処理機能のための音声認識機能４１６を同様に実装するかまたは呼び出すことができる。他の実施形態では、構成要素４０６は他の機能４１８を同様に実装するかまたは呼び出すことができる。一例として、他の機能４１８は、雑音除去または低減、頭字語の拡張または長形式の短縮、代替スペリング選択などの、事前変換機能を含むことができる。いくつかの他の例として、他の機能４１８は、１つまたは複数のカスタムまたは標準辞書、１つまたは複数のカスタムまたは標準シソーラスを呼び出すこと、あるいは音声入力４０２内で認識されるかまたはそこから導出された単語または句の修正または訂正を実行することを、含むことができる。

ある実施形態では、構成要素４０８は変換規則のリポジトリ４２０を使用する。構成要素４０８は、処理された音声入力の変換を実行する際に、リポジトリ４２０から１つまたは複数の変換規則を選択する。

図５を参照すると、この図は例示的実施形態に従った音声入力アプリケーションにおける変換例のプロセス流れ図を示す。プロセス５００は、図４の音声入力アプリケーション４００内で実装可能である。

ユーザまたはシステムが頭字語「ＩＢＭ」を含む音声入力５０２を提供すると想定してみる（ＩＢＭおよびInternational Business Machinesは、米国および諸外国におけるインターナショナル・ビジネス・マシーンズ・コーポレーションの商標である）。処理５０４は音声入力５０２の入力者を認証し、音声入力５０２で音声認識を実行し、認識された音声を処理する。処理５０４の結果として認識された音声入力５０６が生じ、プロセス５００はこれを頭字語として認識する。事前変換修正５０８は、頭字語ＩＢＭを対応する長形式の「International Business Machines」に修正し、これが処理された音声入力５１０を形成する。

プロセス５００は１つまたは複数の選択された変換規則５１２を処理された音声入力５１０に適用する。たとえば選択された変換規則は、処理された音声入力５１０内の各単語の３番目の文字を選択するものとすることができる。選択された変換規則５１２の適用の結果として、エントリ・フィールド入力５１４が生じる。上記の例を使用して、「ＴＳＣ」がエントリ・フィールド入力５１４に対応するデータを形成する。プロセス５００はエントリ・フィールド入力５１４を、エントリ・フィールド内でデータを使用するアプリケーションに送信する。

図６を参照すると、この図は例示的実施形態に従った機密情報の音声入力のプロセス例の流れ図を示す。プロセス６００は、図４の音声入力アプリケーション４００内に実装可能である。

プロセス６００は、音声入力を受信することによって開始される（ステップ６０２）。プロセス６００は、オプションで、周辺雑音または音響などに関する環境検出、デフォルトの変換規則を使用する代わりの変換規則の選択、入力者認証、音声認識、またはそれらの組み合わせなどを実行することができる（ステップ６０４）。

一実施形態では、変換規則は、ある変換規則の使用を事前設定することによって自動的に選択される。こうした変換規則の選択方法では、ユーザは事前設定された変換規則に気付く。

他の実施形態では、音声入力アプリケーションは、使用されている変換規則に関して十分個人的または秘密裡にユーザに通知する。たとえばある実施形態は、イヤフォンが使用されていることを検出し、個別オーディオ・アナウンスを介して「第２文字規則を使用すること」をユーザにアドバイスする。

他の実施形態では、ユーザはユーザ・インターフェースを使用して変換規則セットから変換規則のサブセットを選択する。たとえばユーザは、物理またはソフトウェア生成ボタン、デバイスのジャイロスコープ動作、あるいは選択を実行するための任意の好適な種類のジェスチャを使用することができる。

他の実施形態では、ユーザは、発話された単語、コードワード、コマンド、またはキーワードを使用して、変換規則セットから変換規則のサブセットを選択する。たとえば一実施形態では、「第２文字規則」を使用させるために、ユーザは規則を示すための第１の単語を発話する。「Broccoli Epilog Camera AssignEssential」では、第１の単語を使用して残りの単語を解釈するための変換規則を選択する。単語「Broccoli」からの文字「Ｂ」はアルファベットの第２文字であり、実施形態によって、ユーザがそれに続く各単語の第２文字を使用したいこと、すなわち前述の例で説明した第２文字規則を示すために使用される。

プロセス６００は、事前変換処理を音声入力に適用する（ステップ６０６）。プロセス６００は、ステップ６０６を必要な回数だけ反復することによって、任意回数の事前変換処理を適用することができる。たとえばプロセス６００は、話者非依存または話者依存の音声認識を使用するために実装可能である。一実施形態では、プロセス６００は、ユーザの生体認証を容易にする、トレーニング・セットとして以前に使用されたユーザの音声に関する認識を改善する、次善の環境での音声認識の精度を向上させる、またはそれらの組み合わせのために、話者依存音声認識を使用するために実装される。

プロセス６００は、１つまたは複数のデフォルトまたは選択された変換規則に従って、処理された音声入力を変換する（ステップ６０８）。プロセス６００は、この変換からエントリ・フィールド入力を生成する（ステップ６１０）。プロセス６００は、このエントリ・フィールド入力をエントリ・フィールドに出力する（ステップ６１２）。その後、プロセス６００は終了する。

図面内の流れ図およびブロック図は、本発明の様々な実施形態に従ったシステム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。この点で、流れ図またはブロック図内の各ブロックは、指定された論理機能を実装するための１つまたは複数の実行可能命令を含む、モジュール、セグメント、またはコードの一部を表すことができる。いくつかの代替の実装では、ブロック内に示された機能が図面内に示された順序とは異なる順序で実行可能であることにも留意されたい。たとえば、連続して示される２つのブロックは実際にはほぼ同時に実行可能であるか、ブロックは関連する機能に応じて時には逆の順序で実行可能である。ブロック図あるいは流れ図またはその両方の各ブロックは、指定された機能または動作を実行する特定用途向けハードウェアベース・システム、あるいは特定用途向けハードウェアおよびコンピュータ命令の組み合わせによって実装可能であることにも留意されよう。

このようにして、コンピュータ実装の方法、システム、およびコンピュータ・プログラム製品が、機密情報の音声入力のための例示的実施形態内に提供される。ある実施形態は、あるアプリケーションにおいて音声認識とデータ入力との間に論理の層として実装可能である。ある実施形態は、ユーザまたはシステムが１つの音声パターンを生成できるようにする一方で、音声パターンから計算された無関係のデータを入力することによって、機密情報を難読化する。

音声パターンのプロバイダは、ある実施形態をいくつかのエントリ・フィールドに対しては選択的に使用し、他に対しては使用しないことができる。ある実施形態は、変換規則の選択肢を音声パターンのプロバイダに提供することができるか、または変換規則を自動的に選択してよい。

ある実施形態は、生体認証などの他のデータ・セキュリティ機能および他の方法と共に実装可能である。たとえばある実施形態は、ユーザ位置の全地球測位システム（ＧＰＳ）を介した位置把握を使用して、ユーザが安全な位置に居るかどうか、および強力な変換規則または緩い変換規則のいずれを使用するかを決定することができる。

当業者であれば理解されるように、本発明の態様はシステム、方法、またはコンピュータ・プログラム製品として具体化することができる。したがって本発明の態様は、完全にハードウェア実施形態、完全にソフトウェア実施形態（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）、あるいは、本明細書ではすべてが全体として「回路」、「モジュール」、または「システム」と呼ばれる場合のあるソフトウェアとハードウェアの態様を組み合わせた実施形態の、形を取ることができる。さらに本発明の態様は、１つまたは複数のコンピュータ読み取り可能ストレージ・デバイス、またはその上に具体化されたコンピュータ読み取り可能プログラム・コードを有するコンピュータ読み取り可能媒体内に具体化された、コンピュータ・プログラム製品の形を取ることができる。

１つまたは複数のコンピュータ読み取り可能ストレージ・デバイスあるいはコンピュータ読み取り可能媒体の任意の組み合わせを使用することができる。コンピュータ読み取り可能媒体は、コンピュータ読み取り可能信号媒体またはコンピュータ読み取り可能記憶媒体とすることができる。コンピュータ読み取り可能ストレージ・デバイスは、たとえば、電子、磁気、光、電磁、赤外線、または半導体のシステム、装置、またはデバイス、あるいはそれらの任意の好適な組み合わせとすることができるが、これらに限定されるものではない。コンピュータ読み取り可能ストレージ・デバイスのより具体的な例（非網羅的リスト）は、１本または複数本のワイヤを有する電気接続、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、光ファイバ、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、光ストレージ・デバイス、磁気ストレージ・デバイス、またはそれらの任意の好適な組み合わせを含むものである。本書との関連において、コンピュータ読み取り可能ストレージ・デバイスは、命令実行のシステム、装置、またはデバイスによって、あるいはそれらに関連して使用するためのプログラムを含むかまたは格納することが可能な、任意の有形のデバイスまたは媒体とすることができる。

コンピュータ読み取り可能ストレージ・デバイスまたはコンピュータ読み取り可能媒体上に具体化されたプログラム・コードは、無線、有線、光ファイバ・ケーブル、ＲＦなど、またはそれらの任意の好適な組み合わせを含むがこれらに限定されない任意の適切な媒体を使用して、伝送可能である。

本発明の態様に関する動作を実行するためのコンピュータ・プログラム・コードは、Ｊａｖａ、Ｓｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語、および、「Ｃ」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む、１つまたは複数のプログラミング言語の任意の組み合わせで作成可能である。プログラム・コードは、完全にユーザのコンピュータ上、部分的にユーザのコンピュータ上、スタンドアロン型ソフトウェア・パッケージとして、一部はユーザのコンピュータ上および一部はリモート・コンピュータ上、または、完全にリモート・コンピュータまたはサーバ上で、実行可能である。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを介して、ユーザのコンピュータに接続することができるか、あるいは（たとえばインターネット・サービス・プロバイダを使用するインターネットを介して）外部コンピュータに接続することができる。

本明細書では、本発明の実施形態に従った方法、装置（システム）、およびコンピュータ・プログラム製品の流れ図あるいはブロック図またはその両方を参照しながら、本発明の態様について説明している。流れ図あるいはブロック図またはその両方の各ブロック、および、流れ図あるいはブロック図またはその両方におけるブロックの組み合わせは、コンピュータ・プログラム命令によって実装可能であることを理解されよう。これらのコンピュータ・プログラム命令は、１つまたは複数の汎用コンピュータ、特定用途向けコンピュータ、または機械を作製するための他のプログラマブル・データ処理装置の、１つまたは複数のプロセッサに提供可能であり、結果として命令は、コンピュータまたは他のプログラマブル・データ処理装置の１つまたは複数のプロセッサを介して実行し、流れ図あるいはブロック図またはその両方のブロックに指定された機能／動作を実装するための手段を作成することになる。

これらのコンピュータ・プログラム命令は、１つまたは複数のコンピュータ、１つまたは複数の他のプログラマブル・データ処理装置、あるいは１つまたは複数の他のデバイスに対して、特定の様式で機能するように指示することが可能な、１つまたは複数のコンピュータ読み取り可能ストレージ・デバイスまたはコンピュータ読み取り可能媒体内にも格納可能であり、結果として、１つまたは複数のコンピュータ読み取り可能ストレージ・デバイスまたはコンピュータ読み取り可能媒体内に格納された命令は、流れ図あるいはブロック図またはその両方のブロックに指定された機能／動作を実装する命令を含む製品を作製することになる。

コンピュータ・プログラム命令は、コンピュータ実装プロセスを生成するために、１つまたは複数のコンピュータ、１つまたは複数の他のプログラマブル・データ処理装置、あるいは１つまたは複数の他のデバイス上で一連の動作ステップを実行させるために、１つまたは複数のコンピュータ、１つまたは複数の他のプログラマブル・データ処理装置、あるいは１つまたは複数の他のデバイス上にロードすることも可能であり、結果として、１つまたは複数のコンピュータ、１つまたは複数の他のプログラマブル・データ処理装置、あるいは１つまたは複数の他のデバイス上で実行する命令が、流れ図あるいはブロック図またはその両方のブロックに指定された機能／動作を実装するためのプロセスを提供することになる。

本明細書で使用される用語は、単に特定の実施形態を説明するためのものであり、本発明を限定することは意図されていない。本明細書で使用される場合、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈に明確に示されていない限り、複数形も含むことが意図される。さらに、「comprise（含む）」あるいは「comprising（含んでいる）」またはその両方の用語は、本明細書で使用される場合、記載された機能、整数、ステップ、動作、要素、あるいは構成要素、またはそれらすべての存在を指定するものであるが、１つまたは複数の他の機能、整数、ステップ、動作、要素、構成要素、あるいはそれらのグループ、またはそれらすべての存在、または追加を除外するものではないことを理解されよう。

以下の特許請求の範囲におけるすべての手段またはステップならびに機能要素の対応する構造、材料、動作、および等価物は、具体的に請求された他の請求要素と組み合わせて機能を実行するための任意の他の構造、材料、または動作を含むことが意図されている。本発明の説明は、例示および説明のために提示されてきたものであり、開示された形の本発明を網羅するかまたはこれに限定されることは意図されていない。当業者であれば、本発明の範囲および趣旨を逸脱することなく、多くの修正および変形が明らかとなろう。実施形態は、本発明の原理および実際の適用例を最も良く説明するように、ならびに、他の当業者が、企図された特定の用途に適した様々な修正を伴う様々な実施形態について本発明を理解できるように、選択および説明されたものである。

１００データ処理環境
１０２ネットワーク
１０４、１０６サーバ
１０８ユニット
１１０クライアント
１２０、２３６デバイス
１２２フィールド
１２４音声
１２６、３０４ユーザ
２００、３０２データ処理システム
２０２、２０４ハブ
２０６処理ユニット
２０８メモリ
２１０プロセッサ
２１２、２１６、２２０アダプタ
２２２モデム
２２４読み取り専用メモリ
２２６ドライブ
２３２ポート
２３４ＰＣＩｅデバイス
２３８、２４０バス
３０６、４０２音声入力
３０８マイクロフォン
３１０、４００音声入力アプリケーション
３１２アプリケーション
４１４許可機能
４１６音声認識機能
４１８機能
４２０リポジトリ
５００プロセス
５０２、５０６、５１０音声入力
５０８事前変換修正
５１２変換規則
５１４フィールド入力

Claims

プロセッサおよびメモリを使用して音声入力に対して変換規則を適用すること、
エントリ・フィールド入力を生成することであって、前記変換規則は、前記音声入力が前記エントリ・フィールド入力とは区別されるものであることを可能とし、前記音声入力は前記エントリ・フィールド入力を難読化する、生成すること、および
アプリケーションに前記エントリ・フィールド入力を提供することであって、前記エントリ・フィールド入力は前記アプリケーション内のデータ・エントリ・フィールドに読み込むために使用される、提供すること、
を含む、情報の音声入力のためのコンピュータ実装方法。
前記変換規則が変換規則リポジトリから選択される、請求項１に記載のコンピュータ実装方法。
入力を受信することであって、前記入力は前記変換規則を選択するために使用される、受信すること、
をさらに含む、請求項２に記載のコンピュータ実装方法。
前記入力が発話された入力であり、前記発話された入力は、前記発話された入力の目的として前記変換規則を選択することを難読化する、請求項３に記載のコンピュータ実装方法。
前記変換規則がデフォルトの変換規則に置き換えられる、請求項２に記載のコンピュータ実装方法。
前記音声入力を受信する前に、前記選択された変換規則に関して前記音声入力の入力者に通知すること、
をさらに含む、請求項２に記載のコンピュータ実装方法。
前記音声入力に対して事前変換処理を適用することであって、前記事前変換処理は前記音声入力の入力者を認証することを含む、適用すること、
をさらに含む、請求項１に記載のコンピュータ実装方法。
前記音声入力に対して事前変換処理を適用することであって、前記事前変換処理は前記音声入力について音声認識を実行することを含む、適用すること、
をさらに含む、請求項１に記載のコンピュータ実装方法。
前記音声入力が生成される環境の特徴を検出すること、および
前記環境の前記特徴に応答して前記変換規則を選択すること、
をさらに含む、請求項１に記載のコンピュータ実装方法。
前記音声入力を受信すること、
をさらに含む、請求項１に記載のコンピュータ実装方法。
前記音声入力がデータ処理システムによって提供される、請求項１に記載のコンピュータ実装方法。
前記変換規則が、辞書を使用して前記音声入力に含まれる頭字語を長形式の変換（long-form translation）に拡張し、
前記頭字語に対応する前記長形式の変換に対して第２の変換規則を適用すること、
をさらに含む、請求項１に記載のコンピュータ実装方法。
前記辞書が前記音声入力の入力者に対応するカスタム辞書である、請求項１２に記載のコンピュータ実装方法。
前記変換規則が、前記音声入力の一部に対応する単語内の所定のオフセットの文字を選択し、前記文字が前記エントリ・フィールド入力の一部を形成する、請求項１に記載のコンピュータ実装方法。
前記変換規則が複数の変換規則であり、前記複数の変換規則のそれぞれが、事前変換処理中に前記音声入力に対して所定の順序で実行される、請求項１に記載のコンピュータ実装方法。
前記音声入力が少なくとも１つの単語を含み、前記少なくとも１つの単語が、以前の音声入力における前記少なくとも１つの単語の使用に依存して受け入れられる、請求項１に記載のコンピュータ実装方法。
情報の音声入力のためのコンピュータ使用可能コードを含むコンピュータ使用可能記憶媒体を備えるコンピュータ使用可能プログラムであって、前記コンピュータ使用可能コードは、
プロセッサおよびメモリを使用して音声入力に対して変換規則を適用ためのコンピュータ使用可能コードと、
エントリ・フィールド入力を生成するためのコンピュータ使用可能コードであって、前記変換規則は、前記音声入力と前記エントリ・フィールド入力とを区別することを可能とし、前記音声入力は前記エントリ・フィールド入力を難読化する、生成するためのコンピュータ使用可能コードと、
アプリケーションに前記エントリ・フィールド入力を提供するためのコンピュータ使用可能コードであって、前記エントリ・フィールド入力は前記アプリケーション内のデータ・エントリ・フィールドに読み込むために使用される、提供するためのコンピュータ使用可能コードと、
を含む、コンピュータ使用可能プログラム。
前記コンピュータ使用可能コードはデータ処理システム内のコンピュータ読み取り可能記憶媒体に格納され、前記コンピュータ使用可能コードはリモート・データ処理システムからネットワークを介して転送される、請求項１７に記載のコンピュータ使用可能プログラム。
前記コンピュータ使用可能コードはサーバ・データ処理システム内のコンピュータ読み取り可能記憶媒体に格納され、前記コンピュータ使用可能コードは、リモート・データ処理システムに関連付けられたコンピュータ読み取り可能記憶媒体内で使用するために、前記リモート・データ処理システムへネットワークを介してダウンロードされる、請求項１７に記載のコンピュータ使用可能プログラム。
情報の音声入力のためのデータ処理システムであって、
記憶媒体を含むストレージ・デバイスであって、前記ストレージ・デバイスはコンピュータ使用可能プログラム・コードを格納する、ストレージ・デバイスと、
プロセッサであって、前記プロセッサは前記コンピュータ使用可能プログラム・コードを実行し、前記コンピュータ使用可能プログラム・コードは、
プロセッサおよびメモリを使用して音声入力に対して変換規則を適用ためのコンピュータ使用可能コード、
エントリ・フィールド入力を生成するためのコンピュータ使用可能コードであって、前記変換規則は、前記音声入力と前記エントリ・フィールド入力とを区別することを可能とし、前記音声入力は前記エントリ・フィールド入力を難読化する、生成するためのコンピュータ使用可能コード、および
アプリケーションに前記エントリ・フィールド入力を提供するためのコンピュータ使用可能コードであって、前記エントリ・フィールド入力は前記アプリケーション内のデータ・エントリ・フィールドに読み込むために使用される、提供するためのコンピュータ使用可能コード、
を含む、プロセッサと、
を備える、データ処理システム。