JP2001222294A - 無線通信装置のためのユーザインターフェースに基づく音声認識 - Google Patents

無線通信装置のためのユーザインターフェースに基づく音声認識

Info

Publication number
JP2001222294A
JP2001222294A JP2000356405A JP2000356405A JP2001222294A JP 2001222294 A JP2001222294 A JP 2001222294A JP 2000356405 A JP2000356405 A JP 2000356405A JP 2000356405 A JP2000356405 A JP 2000356405A JP 2001222294 A JP2001222294 A JP 2001222294A
Authority
JP
Japan
Prior art keywords
wireless communication
user
network
data file
markup language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000356405A
Other languages
English (en)
Inventor
Peter F King
エフ キング ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PHONE COM JAPAN KK
Phonecom Japan Kk
Original Assignee
PHONE COM JAPAN KK
Phonecom Japan Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26863029&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2001222294(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by PHONE COM JAPAN KK, Phonecom Japan Kk filed Critical PHONE COM JAPAN KK
Publication of JP2001222294A publication Critical patent/JP2001222294A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2207/00Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
    • H04M2207/18Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place wireless networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 本発明の目的は、音声認識処理をローカルに
行う資源又はソフトウェアを有さない移動装置に対する
音声認識サービスを得るための方法を提供することであ
る。 【解決手段】 サービスを受ける移動装置から受信され
た音声入力を、移動装置により処理可能な記号的データ
ファイル(例えば、英数字又は制御文字)に翻訳する遠
隔音声認識サーバシステムを使用する、無線通信システ
ムである。翻訳処理は、移動装置と音声認識サーバ間の
音声通信を確立することにより開始する。そして、移動
装置のユーザは、音声認識サーバシステムにより検出さ
れうるように話し始める。ユーザのスピーチの検出に際
し、音声認識サーバシステムはスピーチを記号的データ
ファイルへ翻訳し、そして、記号データファイルは、別
のデータ通信チャネルを介してユーザへ送られる。ユー
ザは、移動装置で記号的データファイルを受信すると、
再見しそして、記号的データファイルの内容を編集し、
そして、更にファイルを望むように使用する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的には、デー
タ通信に関し、特にローカルユーザインターフェースを
増加するための音声認識資源に基づくネットワークを使
用する2方向無線通信システムに関する。
【0002】
【従来の技術】無線通信システムの領域には、ハイパー
テキストに基づく技術の使用が広がっている。ここでは
移動装置としても記載されているが、2方向無線通信装
置と無線ネットワークプロトコルは、インターネット及
び、プライベートネットワークのような種々の無線及び
有線ネットワークを介して、遠隔情報サービス(多と商
用データベース、電子メール、オンラインショッピン
グ)へのインターラクティブアクセスを許すように設計
されている。
【0003】多くの移動装置(例えば、セルラ電話)
は、量販向きの装置である。それらのユーザインターフ
ェースは、装置の機能を制限せずに、単純で簡単に使用
できるべきである。現在、多くの移動装置のデータ入力
の主な方法は、長い英数字文字列を入力するのに使用す
るには、比較的効率の悪い、キーパッドである。サイズ
の制約とコストの考慮により、これらの移動装置のキー
パッドは、実質的なユーザ入力を要するメッセージ(例
えば、電子メール)を作るためには、特にユーザフレン
ドリーなインターフェースではない。この種のキーパッ
ドは、通常は12又は、24キーを有し、数字入力に対
しては十分であるが、しかし、ネットワークができる装
置に対して要求される英数字データ入力を扱うには非常
に効率が悪い。
【0004】インターネットから情報を要求するユーザ
は、一般的には、ブラウザを使用してワールドワイドウ
ェブを操作する。例えば、サーチエンジンとして、In
foseekTMを使用して、スタンフォード大学の情
報を要求するユーザは、以下の文字列”http://
www.infoseek.com.”と続いて”St
anford University” を入力する必
要がある。
【0005】上述の検索文字列は40文字以上である。
ユーザは、標準的なデスクトップコンピュータキーボー
ドとブラウザ(例えば、ネットスケープ又はエクスプロ
−ラ)を使用してこの種の文字列を入力するのは問題が
ない。しかし、同じユーザが同じ文字列を入力するのに
移動装置のキーパッドを操作すると、小さいキーボード
とキー間の間隔が近いために非常に自由な動きが妨げら
れる。
【0006】インターネットの共通の使用の1つは電子
メールである。上述のパラグラフのサイズを有する電子
メールメッセージを送りたいユーザは、40文字以上を
入力しなければならない。デスクトップコンピュータの
標準キーボードを使用して、ユーザは、(ユーザが平均
的なタイプの能力を有すれば、)2分以下でその数の文
字を入力することができるであろう。移動装置のキーパ
ッド上で同数のキーストロークを入力するのは非常に時
間がかかり、そして、非常に単調で退屈であり、誤りや
すくなる。
【0007】音声認識(VR)技術の近年の進歩と、ハ
ードウェア能力の向上は、デスクトップシステムに関す
る音声認識に基づくユーザインターフェースの開発を商
業的に可能としている。VR技術は、話された単語をと
り、それを、ディジタルシステムにより簡単に操作され
且つ表示されることができるフォーマットに翻訳する。
VR技術を小型移動装置に装備する努力が行われている
が、しかし、これらの努力は一般的には、余分な部品
や、処理及び蓄積能力の増加のような、(例えば、DS
Pチップのような)コストのかかる装置の変更を必要と
する。典型的なセルラ電話は、典型的なデスクトップ又
は携帯コンピュータに設けられている1パーセント以下
の計算資源を有する。規模の小さいVRアプリケーショ
ンを実行するこの種の電話は装置の部品を変更すること
なしに、予め定義された小さなグループの話された言葉
のみを認識できる。
【0008】デスクトップ及びラップトップコンピュー
タで利用できる(例えば、ドラゴンシステム社のナチャ
ラリースピーキング、アップルコンピュータからのPl
ainTalkTM、IBMからのViaVoice9
TM、及び、フィリップストークからのFreeSp
eech98TMのような)音声認識ソフトウェアは、
ライセンス当り39.00ドルから数100ドルであ
る。これは、比較できるソフトウェアアプリケーション
を備えた移動装置のコストの大きな部分を表す。
【0009】音声認識ソフトウェアを各移動装置に配置
しそして、アプリケーションが実行できるようにハード
ウェア部品を変更することは、VR特徴をその装置に組
み込む電話製造者の、財政的な意欲をくじく。これらの
変更は移動装置の最終価格に大きなコストを加え、価格
は、通常に、量販移動装置(例えば、セルラ電話)に占
められている目標価格(例えば、150ドル)の範囲外
となろう。
【0010】ハードウェア資源に関しては、これらのア
プリケーションは各言語をサポートするのに60メガバ
イトまでののメモリを要する。更に、多くの商用の音声
認識ソフトウェアアプリケーションは、比較的高速なプ
ロセッサ(例えば、133MHzペンティアム(登録商
標)プロセッサ)を有するシステムで動作するように設
計されている。
【0011】
【発明が解決しようとする課題】移動装置が、ディジタ
ルネットワークと更に効率的な方法で、対話できること
を可能とする装置と方法への要求が大きい。ハードウェ
ア資源とコストを大きく変更せずに標準の移動装置のユ
ーザインターフェエース(例えば、電話キーパッド)と
共に音声認識サービスを利用することができる能力は、
制限された資源を有するネットワークのできる移動装置
の利用性と商業的な可能性を劇的に改善する。
【0012】
【課題を解決するための手段】本発明は、移動装置から
受信された音声入力を、移動装置により処理可能な記号
的データファイル(例えば、英数字又は制御文字)に翻
訳する遠隔音声認識サーバシステムを使用する、無線通
信システムに関する。翻訳処理は、移動装置と音声認識
サーバ間の音声通信を確立することにより開始する。そ
して、移動装置のユーザは、音声認識サーバシステムに
より検出されうるように話し始める。ユーザのスピーチ
の検出に際し、音声認識サーバシステムはスピーチを記
号的データファイルへ翻訳し、そして、記号データファ
イルは、別のデータ通信チャネルを介してユーザへ送ら
れる。ユーザは、移動装置で記号的データファイルを受
信すると、再見しそして、記号的データファイルの内容
を編集し、そして、更にファイルを望むように使用す
る。例えば、ユーザは、記号的データファイルを、電子
メール又は、ブラウザ要求フィールドをうめるのに使用
する。
【0013】本発明は、方法、装置又は、素子、ユーザ
インターフェース、コンピュータ読出し可能なメモリ及
び、システムを含む、多くの方法で使用できる。本発明
の幾つかの実施例を以下に示す。
【0014】1つの実施例によれば、本発明は、音声認
識処理をローカルに行う資源又はソフトウェアを有さな
い移動装置に対する音声認識サービスを得るための方法
である。方法は、対象の移動装置と音声認識アプリケー
ション(ここでは、音声認識サーバシステムと呼ぶ)を
実行する遠隔サーバ間で音声チャネルを確立し互いに作
用する移動装置内にあるローカルアプリケーションを使
用することを含む。
【0015】音声チャネルの確立に際し、対象の移動装
置のユーザは、移動装置(例えば、セルラ電話)のマイ
クロフォンに向かって話し始めるのを待たされる。この
対話の結果音声認識サーバシステムで受信された音声入
力は、記号的データファイルに変換される。この処理
は、以前に蓄積されたユーザに特定のデータファイルに
より援助され得る。記号的データファイルは、元の移動
装置又は指定された第三者の装置へ別に確立され相互に
作用するデータ通信チャネルを介して元に転送される。
記号的データファイルは、移動装置上のローカルアプリ
ケーションと対話する又は、ネットワーク資源(例え
ば、インターネット又は、プライベートネットワーク上
のサーバ)と対話するのに使用される。
【0016】前述の説明と共に、他の目的及び、優位点
は、図を参照して以下の説明により得られる。
【0017】
【発明の実施の形態】本発明は、図を参照して以下の詳
細な説明により容易に理解される。
【0018】以下の本発明の詳細な説明では、本発明の
完全な理解のために多くの特定の詳細が説明される。し
かし、当業者には、本発明はこれらの特定の詳細が無く
とも実行できることは明らかである。既知の方法、手
続、構成要素及び、回路は、本発明の特徴を扶養に曖昧
にするのを避けるために詳細には説明しない。以下の本
発明の詳細な説明は主に、手続、ステップ、論理ブロッ
ク、処理及び、ネットワークに接続されたデータ処理装
置に似た他の記号的な表現により示される。これらの処
理記述と表現は当業者に最も効率的に仕事の実体を示す
手段である。
【0019】本発明は、システム及び、方法に関し、移
動装置が、ネットワーク化された音声認識サーバシステ
ムからの音声認識サービスへアクセスすることを可能と
する。本発明の1つの実施例によれば、音声認識サービ
スは、音声認識サービスを望んでいる移動装置のユーザ
とネットワーク化された音声認識サーバシステム間の音
声チャネルを確立することによりアクセスされる。
【0020】一旦音声チャネルが確立されると、移動装
置のユーザには、音声認識システムがスピーチ信号を受
信することの準備が完了すると、話し始めることの待ち
が与えられる。受信されたスピーチ信号は、従来技術で
既知の音声認識技術(例えば、テンプレートマッチン
グ、フーリエ変換又は、線形予測符号化(LPC)))
を使用して音声認識サーバシステムにより処理され、記
号的データファイルが発生される。
【0021】記号データファイルは複数の文字、音素、
単語、図、オブジェクト、コントロール文字又は、オブ
ジェクトを指定する他の従来のマーク、量、動作、機
能、音素、単語、フレーズ又は、受信された音声スピー
チ信号と関連を有するそのどのような組合せを有する、
音声認識システムにより翻訳されたファイルである。音
声認識システムは、一般的には、音声テンプレート、フ
ーリエ変換符号化又は、線形予測符号化機構を使用し
て、音声入力成分を予め蓄積された記号的基礎単位へマ
ップする。記号的データブロックの例はASCIIファ
イルと2値データファイルを含む。
【0022】本発明の説明を容易にするために、本発明
が実行され得る通信システムの特徴を列挙するのが有益
である。図1から4は、原理的なシステム構成要素の概
略である。
【0023】図1は、本発明の実施例に従った、典型的
な通信システムのブロック図を示す。移動装置102と
103は、音声通信チャネルを通して通話を受信し且
つ、ハイパーメディア情報(例えば、ハイパーテキスト
マークアップ言語(HTML)書類、コンパクトハイパ
ーテキストマークアップ言語(cHTML)書類、拡張
可能なマークアップ言語(XML)書類、携帯装置マー
クアップ言語(HDML)書類、無線マークアップ言語
(WML)書類又は、同様なデータ形式)を遠隔サーバ
装置から、リンクサーバ装置106とショートメッセー
ジサービスセンタ(SMSC)107を有し得る広帯域
及び狭帯域(例えば、SMS)データ通信チャネルを通
して受信する。
【0024】移動装置102と103の各々はディスプ
レイとユーザインターフェースを有する。更に移動装置
102と103は、ローカルメモリ(クライアントモジ
ュールと称す)に蓄積された、装置がハイパーメディア
情報を処理することを可能とする遠隔サーバから受信さ
れたマイクロブラウザ(例えば、94063 CA、レ
ッドウッドシティ、チェサピークドライブ 800のP
hone.com社からのマイクロブラウザ)を有し得
る。
【0025】図1に示すように、移動装置102と10
3は、無線キャリアネットワーク104(ここでは無線
ネットワークと呼ぶ)を介してリンクサーバ106と接
続される。移動装置102と103は、移動電話、手の
ひらサイズの計算装置及び、音声送信及び/又は受信能
力を有する個人ディジタルアシスタントを含むグループ
に含まれる。音声能力は、ユーザが遠隔の行き先(例え
ば、他のユーザ又は、装置)と、音声に基づく情報を通
信できる移動装置内に装備された能力として定義され
る。
【0026】音声通信チャネルへのアクセスは一般的に
は、ユーザ及び/又は装置が、無線キャリアネットワー
ク104により認識されることを要する。ネットワーク
認識は、対象の移動装置と無線キャリアネットワーク1
04間での識別情報の交換に関連する。一般的には、ユ
ーザ及び/又は対象の移動装置の識別情報は、装置のメ
モリに蓄積され、そして、ユーザがネットワークにアク
セスしようとしたときに自動的に伝送される。
【0027】無線キャリアネットワーク104は、どの
ような既知の無線通信ネットワーク(例えば、セルラデ
ィジタルパケットデータ(CDPD)ネットワーク、移
動通信のためのグローバルシステム(GSM)ネットワ
ーク、符号分割多重(CDMA)ネットワーク、パーソ
ナルハンディフォンシステム(PHS)及び時分割多重
アクセス(TDMA)ネットワーク)でも良い。リンク
サーバ106は、更に、音声認識サーバシステム109
とネットワークサーバ113により表される複数のネッ
トワーク化されたサーバが接続された有線ネットワーク
108接続される。
【0028】音声認識サーバシステム109は、サーバ
装置110と、他のものの間にキャリア事業者による複
数のユーザのサービスに関連するユーザに特定のファイ
ルを蓄積できる蓄積装置112を有する。ユーザに特定
のファイルは、音声認識処理と共に使用され、そして1
つの実施例は本発明の一部である。
【0029】ユーザに特定のファイルの例は、ユーザに
特定のスピーチテンプレート、1つ又はそれ以上のユー
ザに特定の言語辞書(例えば、フランス語、英語、ドイ
ツ語又は、広東語)及び、1つ又はそれ以上のユーザに
特定の辞書又は、個々のユーザの頻繁に使用する単語の
リストを含み得る。これらのファイルは、アップロード
され、そして、ネットワークマルチメディアコンピュー
タ(例えば、マルチメディアコンピュータ140)又
は、サービスされている移動装置のユーザインターフェ
ースを使用して管理される。例えば、音声テンプレート
は、ユーザに予め定められた原稿を音声可能な装置へ読
ませることにより発生される。ユーザの嗜好(例えば、
選択の言語)は、移動装置のディスプレイ上でユーザに
提示されるメニュー選択スクリーン又は有線ネットワー
クを介して音声認識サーバシステムに接続されている他
の装置を使用して入される。
【0030】簡単のために、アンテナ121は、一般的
に基地局と操作及び維持センタを有する無線キャリア通
信設備を表す。基地局は、移動装置102と103との
無線又は通信接続を制御する。操作及び維持センタは、
移動装置と他の固定又は移動ネットワークユーザの間の
通話を切り替える移動切り替えセンタを含む。さらに、
操作及び維持センタは、認証のような移動口座サービス
を管理し、無線ネットワークの適切な動作と設定を統括
する。キャリア通信設備121内の各々のハードウェア
構成要素と処理は、当業者には既知であり、そして、本
発明の特徴を不要に曖昧にするのを避けるためにここで
は、説明しない。
【0031】無線ネットワーク104により使用される
通信プロトコルは、例えば、無線アクセスプロトコル
(WAP)又は、携帯装置転送プロトコル(HDTP)
である。有線ネットワーク108は、インターネット、
プライベートネットワーク又は、任意のネットワークの
データネットワークである地上ベースのネットワークで
ある。典型的には、地上ネット118をサポートする通
信プロトコルは、転送制御プロトコル/インターネット
プロトコル(TCP/IP)、ハイパーテキスト転送プ
ロトコル(HTTP)又は、安全ハイパーテキスト転送
プロトコル(sHTTP)である。
【0032】リンクサーバ106とネットワークサーバ
113は典型的には、例えば、ネットワークライブラリ
とインターネットの接続性を伴なう、サンマイクロシス
テムズ社(http://www.sun.com)の
SPARKステーションのようなコンピュータワークス
テーションである。ネットワークサーバ113は、有線
ネットワーク108に接続された複数のネットワークサ
ーバで表され、移動装置102と103にたいする情報
を含むハイパーメディア情報へアクセスを提供できる。
【0033】リンクサーバ装置106は、単独の装置と
して表され、それゆえ、しばしば、ネットワークゲート
ウェイ又は、無線データサーバと呼ばれる。リンクサー
バ106は、無線キャリアネットワーク104と有線ネ
ットワーク108の間のブリッジとして動作するように
なされることができる。リンクサーバ装置106の機能
は、無線キャリアネットワーク104と有線ネットワー
ク108の間の接続を提供する既知のハードウェアを伴
なう有線ネットワーク108に接続された他のサーバ装
置により行いうることを指摘すべきである。
【0034】前述の音声通信チャネルは、一般的には、
音声チャネル126により表される。この通信チャネル
は、一般的には、通信設備と、通話を設定するための技
術で知られている手続を使用して確立され作用する。
【0035】一般的には、移動装置102と103にサ
ービスを提供する、2つの形式のデータ通信チャネルが
ある。データ通信チャネル128は、広帯域通信チャネ
ルを表す。データ通信チャネル130は、例えば、(シ
ョートメッセージ通信(SMS)サービスチャネル)の
ような狭帯域通信チャネルを表す。これらのデータ通信
経路のいずれかは、移動装置102と103とデータを
送受信するのに使用される。
【0036】本発明の好適な実施例によれば、音声認識
サーバシステム109からの音声認識サービスを望む移
動装置は(例えば、移動装置102と103)、最初に
一般的には、音声チャネル126により表される音声チ
ャネルを確立する。音声認識サーバシステム109にた
いする交信情報(例えば、電話番号又は、ユニフォーム
リソース識別子(URI))は、移動装置にロードされ
る、リンクサーバ106から取り出され又は、直接ユー
ザから入力されたソフトウェアに埋め込まれる。
【0037】一旦音声チャネルが要求する移動装置と音
声認識サーバシステム109の間で確立されると、ユー
ザ情報は音声認識サーバシステムへ転送される。これ
は、要求する移動装置に対し手前に蓄積されたユーザに
特定のファイルをアクセスし、利用することを可能とす
る。ユーザ情報は、別のデータ通信チャネル(例えば、
データ通信チャネル128又は、130)で伝送される
か又は、ユーザにより入力される。ユーザに特定のファ
イルは、一般的には、特定のユーザ口座に特定の特徴を
提供する。例えば、ユーザは、音声認識処理の1つ又は
それ以上の言語を規定する。
【0038】一旦、対象の移動装置/ユーザのユーザに
特定のファイルが取り出されると、ユーザは音声入力を
することを促される(例えば、話はじめる)。この点
で、ユーザは音声認識サービスを利用している間は移動
装置のユーザインターフェース(例えば、電話キーパッ
ド)を使用し得る点に注意することが重要である。ユー
ザが移動装置と入力動作(音声及び、物理的入力)を完
了したとき、ユーザから入力セッションが終了したとの
指示が(音声又は、キー入力)で与えられる。音声認識
サーバシステム109は、音声入力を記号的データファ
イルへ変換し、リンクサーバ106を介して要求する移
動装置へ送られる。
【0039】前述のように、記号データファイルは複数
の文字、音素、単語、図、オブジェクト、機能、コント
ロール文字又は、オブジェクトを指定する他の従来のマ
ーク、量、動作、機能、音素、単語、フレーズ又は、受
信された音声スピーチ信号と関連を有するそのどのよう
な組合せを有する、音声認識システムにより翻訳された
ファイルである。音声認識システムは、一般的には、音
声テンプレート、フーリエ変換符号化又は、線形予測符
号化機構を使用して、音声入力成分を予め蓄積された記
号的基礎単位へマップする。記号的データブロックの例
はASCIIファイルと2値データファイルを含む。
【0040】記号的データファイルは、最初にリンクサ
ーバ106へ送られ、記号的データファイルが広帯域チ
ャネル128と狭帯域チャネル130を介して要求する
移動装置へ送られる前に、更に処理される。移動装置の
ユーザは、受信した記号的データファイルを再見し、そ
してそれを望むように利用する。
【0041】音声認識サーバシステム109により使用
される音声認識アプリケーションの正確さは、使用され
る変換方法と、サイズと言語辞書の言語に依存する。一
般的には、方法(例えば、テンプレートマッチング)に
依存する話者は、98パーセントの正確さであり、話者
に独立の方法(例えば、フーリエ変換及び、線形予測符
号化(LPC))は90から95パーセントの正確さを
有する(www.hitl.washington.e
du−Voice Recognition,Jim
Baumann)。
【0042】本発明の原理に従って、(例えば、移動装
置102と103)の移動装置のユーザは、音声認識ア
プリケーションが装置により実行されるなら必要な大き
なハードウェアとソフトウェアの変更なしにこれらの移
動装置で音声認識サービスにアクセスする。更に、音声
認識処理を実行するソフトウェアは、(移動装置と比較
して)非常に高い処理速度のアクセス可能な且つ大蓄積
容量の遠隔サーバ上にあるので、装置のユーザには、完
全な特徴の音声認識アプリケーションに関連する機能と
資源が与えられる。例えば、音声認識アプリケーション
は、大きな言語辞書、多言語の選択的な言語辞書とユー
ザに特定のファイル(音声テンプレート及び、ユーザに
特化した辞書とリスト)へアクセスし得る。
【0043】図2Aは、例示の移動装置200を示し、
図1の移動装置102と103の1つに対応する。移動
装置200は表示スクリーン204、拡張電話形式キー
パッド210、カーソルナビゲーションキー222と2
24、ソフトキーの組208Aと208B、イアホン2
12A、マイクロフォン212Bを有する。表示スクリ
ーン204は典型的には、テキスト情報とグラフィック
情報を表示できる液晶ディスプレイ(LCD)スクリー
ンである。拡張電話キーパッド210は、好ましくは、
追加の文字(例えば、スペース)と機能(例えば、戻り
及び、クリア)を提供する追加のキーを有する正規の電
話キーパ−ッどである。
【0044】カーソルナビゲーションキー222と22
4で、ユーザは、例えば、204上に表示されたアプリ
ケーションの1つを活性化するために、カーソルと要素
インジケータ216の位置を変えることができる。一般
キー208Aと208Bは、典型的には、ソフトキー機
能識別子214と215で示されるアプリケーションに
特定の機能を実行するのに使用される。当業者には、正
規の電話キーパッドは、本発明の実行するのに必須では
ないことは理解されるべきである。入力機構としてソフ
トキー又は、アイコンを使用する手のひらサイズの計算
装置のようなある移動装置は、しばしば、物理的キーを
全く持たない。
【0045】リンクサーバ装置(例えば図1に示すリン
クサーバ106)と通信セッションを確立するに際し、
移動装置200は、典型的には、装置と対話するユーザ
を援助するために、1つ又はそれ以上のマークアップ言
語カードデッキを受信する。実行の選択により、スクリ
ーン記述命令ファイルとも呼ばれるマークアップ言語カ
ードデッキは、限定されないがしかし、携帯装置マーク
アップ言語(HDML)、ハイパーテキストマークアッ
プ言語(HTML)、コンパクトハイパーテキストマー
クアップ言語(cHTML)、無線マークアップ言語
(WML)、標準一般化マークアップ言語(SGML)
及び拡張可能なマークアップ言語(XML)を含むマー
クアップ言語ファイルである。代わりに、データファイ
ルは、切り取られ、圧縮され、コンパイルされ又は、対
応するマークアップファイルのバージョンに変換され
る。
【0046】図2AのLCDスクリーン204上に現れ
るテキストは例示の表示スクリーンのようである。この
例では、ユーザは以下の選択ができる。 1)ブックマーク 2)検索 3)電子メール 4)ニュース 各選択は、典型的には、ネットワーク上の資源又は、ロ
ーカルソフトウェアアプリケーションにリンクしてい
る。ユーザは上述のメニューからナビゲーションキー2
22と224を使用して要素指示子216によりユーザ
の選択で、選択する。この同じ方法は、ユーザに遠隔サ
ーバ(例えば、図1の音声認識サーバシステム109)
との対話を促すのに使用され得る。
【0047】図2Bは、図1の移動装置102と103
と図2Aの移動装置200の移動装置250の更に詳細
な説明を示す。移動装置250は、入出信号を受ける無
線キャリアネットワーク104に接続された無線制御プ
ロトコル(WCP)インターフェース252を有する。
装置識別子(ID)蓄積装置254は、移動装置250
を外部装置(例えば、図1のリンクサーバ106)に認
識させるために、装置IDを蓄積し且つWCPインター
フェース252へ供給する。装置IDは、移動装置25
0に関連する特定のコードであり、(例えば、図1の1
06)のリンクサーバ装置に関連して典型的には、設け
られるユーザ口座に関連する装置IDに直接対応する。
【0048】移動装置250はプロセッサ268、エン
コーダ/デコーダ264、ワークメモリ258及び、ク
ライアントモジュール256を有する。クライアントモ
ジュール256は、ロードされ又は、装置メモリに蓄積
されたソフトウェア構成要素を表し、移動装置250に
より行われる、無線キャリアネットワーク104を介し
てのリンクサーバとの通信セッションの確立、ローカル
アプリケーションの動作と操作、移動装置250の表示
スクリーン260への情報の表示、キーパッド262か
らのユーザ入力の受信を含む、多くの処理タスクを行
う。クライアントモジュール256は、計算装置にソフ
トウェアがロードされるのと同じように、移動装置25
0のメモリにロードされる。
【0049】更に、移動装置250は、音声をディジタ
ル及びアナログ通信システムで送受信される電気的イン
パルスへ変換するための、音声回路266を含む。これ
らの構成要素とその機能は、当業者に既知であり以後説
明しない。
【0050】本発明の原理に従って、移動装置200に
ロードされるソフトウェアは、音声認識アプリケーショ
ンを実行するサーバ装置と対話するのに関するユーザの
援助を提供する構成要素を含む。この援助を提供するソ
フトウェアは、マイクロブラウザ又は、他のアプリケー
ション又は、独立のアプリケーションの一部としてロー
ドされうる。このアプリケーションは、サービス、受信
された記号的データファイルの管理及び、ユーザ選択の
入力/変更を提供するサーバ装置の交信情報を取り出し
蓄積するタスクを担う。ユーザ援助は、例えば、スクリ
ーン表示情報、音声又は、触覚のプロンプト及び/又は
機能のマップされたソフトウェアキーである。
【0051】例えば、アプリケーション(例えば、電子
メールメッセージ)と共に音声認識サービスを使用した
いユーザは、対象のアプリケーションにアクセスし、且
つ音声認識サービスにアクセスする為にソフトキーを活
性化する。ソフトキーに関連する機能は、既に蓄積され
ておらず、以下のように処理が進むなら音声認識アプリ
ケーションを実行するサーバ装置に関する交信情報を取
り出す。この例は、説明のために提示され、本発明の範
囲を限定するように解すべきではない。
【0052】図3は、図1のリンクサーバ106に対応
するリンクサーバ340の原理的構成要素の概略を示
す。リンクサーバ340は、有線ネットワーク300と
無線ネットワーク320の間のネットワークゲートウェ
イとして働くサーバコンピュータである。本発明の特徴
を曖昧にするのを避けるために、リンクサーバ340内
の既知の方法、手続、構成要素を及び、回路はは詳細に
は説明しない。
【0053】リンクサーバ340は、有線ネットワーク
300に接続されたランドコントロールプロトコル(L
CP)インターフェース358と、無線ネットワーク3
20に接続された無線制御プロトコル(WCP)インタ
ーフェース341を含む。サーバモジュール310は、
LCPインターフェース358とWCPインターフェー
ス341の間に接続されている。
【0054】サーバモジュール310は、1つの通信プ
ロトコルから他の通信プロトコルへのプロトコル変換と
従来のサーバ処理を実行する。メッセージプロセッサ3
16は、プロトコル変換と関連するタスクを実行する構
成要素である。プロトコル変換(例えば、HDTPとH
TTPの間)の場合には、変換は一般的には、データマ
ッピング処理である。当業者には、WCPインターフェ
ース341は、使用される無線ネットワークとプロトコ
ルに依存して他のインターフェースモジュールにより交
換できることは理解されよう。有線ネットワークとプト
トコルの形式が変わる場合には、LCPインターフェー
ス358についても同様である。
【0055】サーバモジュール310は、口座マネージ
ャ312と口座インターフェース314をも有する。口
座マネージャ312は、典型的には、リンクサーバ装置
340によりサービスを受ける各々の移動装置に対して
の複数のユーザ口座を管理する。ユーザ口座情報は、リ
ンクサーバ装置340に接続された他のネットワークサ
ーバに蓄積されうることに注意すべきである。言い換え
ると、ユーザ口座を、ネットワークを介してリンクサー
バ装置340と接続されたどの計算装置内に物理的に配
置されるデータベース内に保持できる。
【0056】リンクサーバ装置340によりサービスを
受ける各々の移動装置は、識別(ID)又は、装置ID
が割り当てられる。装置IDは、装置の電話番号又は、
IPアドレスとポート番号の組合せであり、例えば、I
Pアドレスが204.163.165.132で、ポー
ト番号が01905の場合には、204.163.16
5.132:01905である。装置IDは更に、移動
装置の加入者口座を活性化する手続の一部として、リン
クサーバ装置340を制御するキャリアにより生成され
管理される加入者IDに更に関連する。
【0057】加入者IDは、特定のユーザ又は、装置に
関連する(例えば、図1の112のような)ユーザに特
定のファイルに関連しアクセスするのに使用され得る。
【0058】加入者IDは、例えば、AT&T無線サー
ビスによる861234567−10900_pn.m
obile.att.netの形式を取り、且つ位相装
置に唯一の識別である。口座マネージャ312は、リン
クサーバ装置340との安全な通信を可能とする移動装
置に関するユーザ口座を生成する。この場合、口座マネ
ージャ312は、サービスを受ける移動装置がリンクサ
ーバ装置340により提供されるサービスに、適切なレ
ベルの安全なアクセスを保証する。
【0059】リンクサーバ装置340は、主なハードウ
ェア部品として、プロセッサ318と蓄積資源320も
有する。プロセッサ318は、サーバモジュール310
の制御のもとで動作を行う。当業者は、リンクサーバ装
置340は、1つ又はそれ以上のプロセッサ(例えば、
プロセッサ318)、ワークメモリ(例えば、ワークメ
モリ320)、バスインターフェース、及び、他の構成
要素を含んでもよく、また、サーバモジュール310は
指定された機能を実行するためにリンクサーバ装置34
0のワークメモリにロードされた1つ又はそれ以上ソフ
トウェアモジュールを示すことは理解されよう。同じ区
別が対象の移動装置のクライアントモジュール及び、ハ
ードウェア構成要素に等しく適用可能である。
【0060】典型的には、地上ネット300によりサポ
ートされている地上ネット通信プロトコル(LPC)
は、転送制御プロトコル(TCP)、ハイパーテキスト
転送プロトコル(HTTP)、安全ハイパーテキスト転
送プロトコル(HTTPS)を含み、且つ、無線制御プ
ロトコル(WCP)は、(TCP)、(HTTP)、
(HTTPS)、携帯装置転送プロトコル(HDT
P)、又は、無線セッションプロトコル(WSP)を含
む。LPCがWCPと異なる場合には、サーバモジュー
ル310は、1つのプロトコルから他のプロトコルへマ
ッピングを行うマッピングモジュール(即ち、マッパ
ー)を含み、それにより、無線ネットワーク320に接
続された移動装置は、有線ネットワーク300に接続さ
れた装置と通信できる。
【0061】受信されたスピーチ信号が音声認識システ
ム(図示していない)により処理されると、記号的デー
タファイルが発生されリンクサーバ装置340へ送られ
る。記号的データファイルは、メッセージプロセッサ3
16により、LCPインターフェース358を介して受
信される。メッセージプロセッサ316は、記号的デー
タファイルを、無線ネットワーク320で(無線ネット
ワークのプロトコル要求と要求する移動装置の装置特性
に関して)最適に搬送され得るデータフォーマットに変
換する。記号的データファイルは、音声認識システムか
ら受信されたときに、例えば、マークアップ言語(例え
ば、HTML)又は、テキストファイル(例えば、AS
CII)の、メッセージプロセッサ316により理解さ
れるフォーマットである。処理された記号的データファ
イルは、要求する移動装置に更に互換性のあるように再
フォーマットされ得るが、要求する移動装置又は、指定
の第三者の装置に転送される。
【0062】図4は、以下の処理1)音声検出、2)音
声分析、3)パターンマッチング、4)記号的ファイル
発生、を行う例示の音声認識サーバシステム460の
(図1の音声認識サーバシステム109に対応する)機
能モジュールを示す。音声検出462中に、音声認識サ
ーバシステム460は、入力でスピーチ信号の存在を検
出する。検出時に、受信されたスピーチ信号は、音声分
析処理464へ送られ、ここで、パターンマッチングに
適する計量可能な指数に減少される。パターンマッチン
グ段階466中は、計量可能な指数は、種々の言語辞書
と複数のユーザに特定のファイルを含み得る蓄積装置4
80に蓄積された(テンプレートに基づくシステムな
ら)ユーザ音声テンプレートと比較される。記号的デー
タファイルは、前述のように有線ネットワーク300
(図3)を介してリンクサーバ装置340へ転送され
る。当業者には、本発明の範囲を超えること無く他の音
声認識システム(例えば、フーリエ変換又は、線形予測
符号化(LPC))が使用できることは理解されよう。
当業者は、リンクサーバ装置(例えば、図1の106)
は、音声認識サーバシステム(例えば、図1の109)
の機能を行うことができることは理解されよう。
【0063】図5は、音声認識サービスを要求する移動
装置と音声認識サーバシステムとの対話に関する例示の
表示スクリーンを示す。最初のスクリーン表示500
は、ユーザがマニュアル入力504とVR(音声認識)
援助入力508の選択を可能とする。ユーザ選択は選択
指示子512により示される。この例では、VR援助入
力512は、ソフトキー識別子516に関連するソフト
キーを活性化することにより、選択される。この選択
は、サービスを提供する音声認識サーバシステムの交信
情報を取り出す。この例では、交信情報は電話番号(例
えば、650−555−7272)よりなる。当業者
は、交信情報は、ユニフォームリソース識別子(UR
I)又は、同様な唯一の識別子よりなることも理解され
よう。ユーザの特定のファイルにアクセスするのに使用
される、関連するユーザ及び/又は装置識別情報は、バ
ックグランド(例えば、データ通信チャネル又は、音声
通信チャネル)又は、ユーザにより入力で伝送され得
る。
【0064】音声認識サーバシステムの交信情報522
の取り出しに際し、スクリーン表示520に示すよう
に、音声チャネルは、ソフトキー機能識別子524(”
OK”)に関連するソフトキーを活性化することにより
確立される。スクリーン表示530は、情報の形式を示
し、要求する移動装置のユーザへ提供される。文字列5
32は、ユーザにサービスを提供する音声認識サーバシ
ステムを提供する。文字列534は、ユーザ要求を処理
するのに使用される設定に関する情報をユーザに供給す
る。これは、単純な文字列(例えば、”初期化デフォル
ト設定”)又は、ユーザが入力選択(例えば、言語選
択)が可能な、複数の対話及びひ対話的表示よりなる。
サービスする音声認識サーバシステムが、入力を受ける
準備ができたときには、ユーザにプロンプト536(”
話しを開始”)が提示される。ユーザはソフトキー機能
識別子538に関連するソフトキーを活性化することに
より入力セッションを終了する。
【0065】音声認識サービスは、要求する移動装置内
にある特定のアプリケーションと対話するように成され
る。例えば、処理された記号的データは、電子メールの
ようなアプリケーションの特定のフィールドの入力とし
て使用するように発生される。更に、一旦アクティブ音
声チャネルが、音声認識サービスに確立されると、ユー
ザは音声通信チャネルを安全にし活再確立すること無し
にサービスを使用してアプリケーションを変更し得る。
例えば、ユーザは電子メールプログラムと個人オルガナ
イザの間で切り替えできる。この特徴は、ユーザのコス
トとネットワークの混雑を減少する。
【0066】図6と図7は、それぞれ、本発明の実施例
に従った移動装置と音声認識サーバの動作を示す処理フ
ローチャートである。図6と図7は図1と共に理解され
るべきである。
【0067】本発明の好適な実施例に従って、音声認識
サービスを望むユーサ゛は、ローカルユーザインターフェー
ス(例えば、キーを押す)を使用してサービスの要求を
開始する。一般的には、ユーザは、(例えば、電子メー
ル又は、ウェブブラウザのような)存在するアプリケー
ションを使用して行われる望むタスクと共に行う。要求
の結果として移動装置に戻る情報は、行われているタス
クに関連する文書内に統合される。
【0068】要求処理は、サービスを要求する移動装置
と、サービスを提供する音声認識サーバシステムの間で
音声チャネルを確立する。一旦音声チャネルが確立され
そして、ユーザは話しの開始を待たされ、ユーザは、音
声入力に加えて(例えば、電話キーパッドの)ローカル
ユーザインターフェースを使用した物理的入力を含む、
移動装置と入力動作を開始する。移動装置との初期入力
動作が完了すると、ユーザは、音声チャネルのオープン
状態をオープンに維持することを選択しそして、他のタ
スクを実行し又は、音声チャネルを終了する。
【0069】図6は、移動装置の観点からの、遠隔音声
認識サーバシステム(例えば、音声認識サーバシステム
109)と対話する(例えば、移動装置102と103
の)移動装置により利用される処理600を示す。60
4では、対象の移動装置と、サービスを提供する音声認
識サーバシステムの間のアクティブな音声チャネルはあ
るか否かが決定される。この処理は、ソフトウェア制御
の下でバックグランドで起こる。
【0070】アクティブな音声チャネルがあると、ユー
ザは608で、ユーザはアクティブな音声チャネルを不
能にしたいか否かを示す入力を提供することが促され
る。これは、移動装置との予定している入力動作にVR
サービスを要しない場合である。
【0071】ユーザが音声チャネルを不能にしようと決
定した場合には、612で不能にされる。そして、ユー
ザは装置のユーザインターフェース(例えば、キーパッ
ド)を使用して物理的入力628へ進む。622で、ユ
ーザ入力(例えば、物理的入力628)が登録されたか
否かに関して決定される。ユーザ入力が登録されたな
ら、632へ進み、ユーザは、636で入力セッション
を継続するか終わらせるかについてを示す入力を供給す
るように促される。ユーザが終了を選択した場合には、
640で、確立された音声チャネル/回路の状態(即
ち、音声チャネル/回路活性化)に関する決定が成され
る。上述のシーケンスでは、アクティブな音声チャネル
はないので処理は終了する。
【0072】608では、ユーザが音声認識サービスを
移動装置入力動作に使用するとして、ユーザが音声チャ
ネルを不能にしないと決定したときには、ユーザは音声
入力624と物理入力628を供給し、そして、622
で、ユーザ入力が登録されたか否かに関する決定が成さ
れる。ユーザ入力が登録された場合には、632で処理
され、ユーザは、636で、入力セッションを継続する
か終わらせるかについてを示す入力を供給するように促
される。ユーザが終了を選択した場合には、640で、
確立された音声チャネル/回路の状態に関する決定が成
される。終了に際し、アクティブな音声チャネル/回路
は安全にされる。処理は終了する。
【0073】ユーザが636で入力セッションを終わら
せないと決定したときには、処理は処理600の先頭に
戻る。
【0074】604で、アクティブ音声チャネルがない
と決定された場合には、ユーザは、614で、ユーザは
アクティブな音声チャネルを確立したいか否かの指示の
入力を促される。これは、ユーザが移動装置との入力動
作で音声認識サービスを要求する場合である。
【0075】614で、ユーザが入力対話動作に音声チ
ャネルを要求する場合には、618で音声チャネルは、
確立される。ユーザは、音声入力624と物理入力62
8を供給し、ユーザの入力が登録されたかに関する決定
が成される。ユーザ入力が登録された場合には、632
で処理され、そして、ユーザは636で、入力セッショ
ンを継続するか終わらせるかについてを示す入力を供給
するように促される。ユーザが終了を選択した場合に
は、上述のように、640で、確立された音声チャネル
/回路の状態に関する決定が成される。終了に際し、ア
クティブな音声チャネル/回路は安全にされる。処理は
終了する。
【0076】614で、ユーザが音声認識サービスを要
求しない場合として、ユーザが妨げる入力動作を音声チ
ャネルに要求しない場合には、ユーザは、移動装置ユー
ザインターフェース(例えば、キーパッド)を使用し
て、物理入力628とともに進む。622で、ユーザの
入力(例えば、物理入力628)が登録されたかに関す
る決定が成される。ユーザ入力が登録された場合には、
632で処理され、そして、636で、入力セッション
が継続されるべきか終了すべきかに関する決定が成され
る。そして、終了する。
【0077】ユーザが636で、入力セッションを終了
しないと決定したなら、処理は処理600の先頭に戻
る。
【0078】上述のこれらの例示的な相互動作で、ユー
ザ入力が622で登録されない場合には、ユーザは63
6で音声認識サーバシステムと共にセッションを終了し
たいか否かについて指示を供給することを促される。
【0079】一旦、サービスを提供する音声認識システ
ムと、サービスを要求する移動装置の間の音声チャネル
が確立されると、音声認識サーバシステムは移動装置の
使用に関連するユーザの特定のファイル(例えば、言語
選択、テンプレートファイル等)を取り出し、そして、
入力音声入力を処理するのにこれらを使用する。音声認
識サーバシステムはサービスの要求に関連する入力する
音声信号を検出し、処理する。入力音声信号はテンプレ
ートマッチング処理、フーリエ変換法、線形予測符号化
機構又は、好適な音声認識符号化機構を使用して、記号
的データファイルに変換され、そして、中間サーバ装置
(例えば、図1のリンクサーバ106のような)データ
通信チャネルを使用して、要求する移動装置(又は、指
定の第三者装置)へ送られる。
【0080】記号データファイルは、要求する移動装置
による処理に適するフォーマット(例えば、cHTM
L、WML又は、HTML)又は、中間サーバ装置よる
処理に適するフォーマット(例えば、HTML,WM
L、XML、ASCII等)であろう。後者の場合は、
中間サーバ装置は必要ならばどのような変換処理も行な
える。
【0081】本発明の原理に従って、移動装置と対話す
るユーザは、音声認識アプリケーションを実行するサー
バ装置に基づく(例えば、音声認識サーバシステム)遠
隔で利用可能な音声認識サービスにアクセスできる。電
話に蓄積されたソフトウェア(例えば、マイクロブラウ
ザ)は、サーバ装置の交信情報を取り出し且つ管理する
ことにより及び、プロンプトを提供し、且つ音声認識サ
ーバシステムと対話するのに関する機能を行うことによ
り、ユーザを援助する。このシステムと方法を使用し
て、制限された処理及び蓄積能力を有する移動装置は、
能力のあるコンピュータワークステーション上で実行さ
れる完全な機能の音声認識アプリケーションにアクセス
できる。
【0082】図7は、それぞれの音声認識サーバシステ
ムから(例えば、移動装置102の)移動装置と対話す
るのに(例えば、音声認識サーバシステム109の)音
声認識サーバシステムにより利用される、処理700を
示すフロー図を示す。704で、(例えば、音声認識サ
ーバシステム109の)音声認識サーバシステムと(例
えば、移動装置102の)移動装置との間に、音声回路
/チャネルが確立されたか否かが、(即ち、ソフトウェ
ア処理により)決定される。
【0083】704で、サービスを要求する移動装置と
音声回路/チャネルが確立された場合には、スピーチ信
号が検出されたかに関する決定が708で成される。7
08で、スピーチ信号が検出された場合には、受信され
たスピーチ入力716は、712で、記号データファイ
ルを発生するのに使用される。
【0084】前述のように、記号データファイルは複数
の文字、音素、単語、図、オブジェクト、コントロール
文字又は、オブジェクトを指定する他の従来のマーク、
量、動作、機能、音素、単語、フレーズ又は、受信され
た音声スピーチ信号と関連を有するそのどのような組合
せを有する、音声認識システムにより翻訳されたファイ
ルである。音声認識システムは、一般的には、音声テン
プレート、フーリエ変換符号化又は、線形予測符号化機
構を使用して、音声入力成分を予め蓄積された記号的基
礎単位へマップする。記号的データブロックの例はAS
CIIファイルと2値データファイルを含む。
【0085】記号データファイルは、720で、要求す
る移動装置(又は、指定された第三者の装置)へ転送さ
れる。724で、要求する移動装置から終了命令が送ら
れたかが決定される。終了命令が受信されると処理は終
了する。終了命令が受信されないときには、処理は70
8で入力するスピーチ信号を捜して継続する。708
で、スピーチ信号が所定の時間期間内に受信されない場
合には、728で、終了命令が送られたかが決定され
る。終了命令が受信されると処理は終了する。終了命令
が受信されなくとも、システムは、処理を終了すること
になる所定のタイムアウト又は、サイクルリミットを有
する。
【0086】704で、サービスを要求する移動装置と
音声回路/チャネルが確立された場合には、音声認識サ
ーバシステムは音声人子Kサービスを望む移動装置との
アクティブ音声チャネルの確立を待つ。
【0087】本発明の原理により、音声認識サーバシス
テムは、移動装置のユーサ゛インターフェースの拡張として
機能する。例えば、ユーザは、通常の状況ではローカル
ユーザインターフェースを使用して入力するにはかなり
の時間のかかる長い対話動作に音声認識システムを使用
することを選択できる。
【0088】
【発明の効果】本発明の優位点は多い。異なる実施は、
以下の1つ又はそれ以上の優位点を有する。本発明の1
つの優位点は、特定の移動装置(例えば、処理及び、蓄
積能力が制限されている装置)のユーザは、標準装置の
ユーザインターフェースを増加する遠隔サーバ装置上で
実行される完全機能の音声認識アプリケーションを使用
できる。
【0089】本発明の他の優位点は、使用される音声認
識アプリケーションは移動装置の処理及び蓄積の制限に
により制限されず、ユーザは、更に能力のあるコンピュ
ータ上で実行される完全機能の音声認識アプリケーショ
ンを使用できる。この機能に関連する優位点は、多量の
語彙を有する辞書及び、個人化された辞書をユーザに供
給できる。更に、音声認識アプリケーションは、移動装
置上に蓄積されていないので、移動装置当りのコストに
衝撃を与えない。更に本発明の他の優位点は、このサー
ビスを提供するキャリアは、アクセスするユーザに低額
のサービス料を要求することができる。
【0090】さらに本発明の他の優位点は、ユーザは、
音声認識サービスとローカルユーザインターフェース
(例えば、電話キーパッド)を同時に利用でき、これに
より、ユーザは最大の柔軟性を得る。例えば、ユーザ
は、音声信号とローカルユーザインターフェースからの
混ぜ合わされた記号を入力できる。
【0091】本発明の多くの特徴と優位点が以上の説明
から明らかであり、請求項は本発明の全ての特徴と優位
点をカバーする。更に、多くの変形及び、変更は当業者
には容易くでき、本発明は、上述の説明の同一の構成と
動作には制限されない。従って、全ての好適な変形と等
価なものは本発明の範囲内である。
【図面の簡単な説明】
【図1】本発明が実行される概略のコンフィグレーショ
ンを示す図である。
【図2A】典型的な音声を利用できる移動装置のディス
プレイとユーザインターフェースを示す図である。
【図2B】例示的な音声を利用できる移動装置の機能ブ
ロック図である。
【図3】本発明の好適な実施例に従ったリンクサーバ装
置の機能ブロック図である。
【図4】本発明の例示の実施例に従った音声認識サーバ
の例示の処理段階を示す概略図である。
【図5】移動装置と音声認識サーバシステムの相互作用
に関する動作を示す、代表的なスクリーン表示を示す図
である。
【図6】本発明の好適な実施例に従った移動装置の観点
からの処理フローチャートである。
【図7】本発明の好適な実施例に従った音声認識サーバ
の観点からの処理フローチャートである。
【符号の説明】
102、103 移動装置 104 無線キャリアネットワーク 106 リンクサーバ 108 有線ネットワーク 109 音声認識サーバシステム 110 サーバ装置 112 蓄積装置 113 ネットワークサーバ 118 地上ネット 121 キャリア通信設備 126 音声チャネル 128 広帯域チャネル 130 狭帯域チャネル 140 マルチメディアコンピュータ 200 移動装置 204 表示スクリーン 208A、208B ソフトキーの組 210 拡張電話形式キーパッド 212B マイクロフォン 212A イアホン 216 要素指示子 222、224 カーソルナビゲーションキー 240 リンクサーバ 250 移動装置 252 WCPインターフェース 256 クライアントモジュール 258 ワークメモリ 264 エンコーダ/デコーダ 266 音声回路 268 プロセッサ 300 有線ネットワーク 310 サーバモジュール 312 口座マネージャ 314 口座インターフェース 316 メッセージプロセッサ 318 プロセッサ 320 無線ネットワーク 340 リンクサーバ装置 341 WCPインターフェース 358 LCPインターフェース 460 音声認識サーバシステム 522 音声認識サーバシステムの交信情報
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04M 11/00 302 G10L 3/00 551A H04Q 7/38 H04Q 7/04 D

Claims (48)

    【特許請求の範囲】
  1. 【請求項1】 表示スクリーンとユーザインターフェー
    スを有する無線通信装置へ、音声認識サービスを提供す
    る方法であって、 音声認識アプリケーションを実行しているサーバ装置で
    音声認識サービスのために、無線通信装置から要求を受
    信するステップと、 第1の通信経路から要求に関連する音声入力信号を取り
    出すステップと、 音声認識アプリケーションを使用して、音声入力信号
    を、記号的なデータファイルへ変換するステップと、 第2の通信経路を使用して、記号的データファイルを無
    線通信装置へ送るステップとを有する方法。
  2. 【請求項2】 第1の通信経路は、無線通信ネットワー
    ク上で確立される請求項1記載の方法。
  3. 【請求項3】 無線通信ネットワークは、セルラディジ
    タルパケットデータ(CDPD)ネットワーク、移動通
    信のためのグローバルシステム(GSM)ネットワー
    ク、符号分割多重(CDMA)ネットワーク、パーソナ
    ルハンディフォンシステム(PHS)及び時分割多重ア
    クセス(TDMA)ネットワークよりなるグループから
    選択される請求項2記載の方法。
  4. 【請求項4】 記号的データファイルはマークアップ言
    語ファイルである請求項1記載の方法。
  5. 【請求項5】 マークアップ言語ファイルは、携帯装置
    マークアップ言語(HDML)、ハイパーテキストマー
    クアップ言語(HTML)、コンパクトハイパーテキス
    トマークアップ言語(cHTML)、無線マークアップ
    言語(WML)、標準一般化マークアップ言語(SGM
    L)及び拡張可能なマークアップ言語(XML)よりな
    るグループから選択される請求項4記載の方法。
  6. 【請求項6】 記号的データファイルはバイナリーデー
    タファイルである請求項1記載の方法。
  7. 【請求項7】 記号的データファイルはASCIIフォ
    ーマットのデータファイルである請求項1記載の方法。
  8. 【請求項8】 第2の通信経路は、第1の通信プロトコ
    ルを使用する有線ネットワークにより音声認識アプリケ
    ーションを実行しているサーバ装置と、第2の通信プロ
    トコルを使用して無線ネットワークにより無線通信装置
    に接続されたリンクサーバ装置を有する請求項1記載の
    方法。
  9. 【請求項9】 第1の通信プロトコルは、転送制御プロ
    トコル/インターネットプロトコル(TCP/IP)、
    ハイパーテキスト転送プロトコル(HTTP)、安全ハ
    イパーテキスト転送プロトコル(sHTTP)よりなる
    グループから選択される請求項8記載の方法。
  10. 【請求項10】 第2の通信プロトコルは、無線通信プ
    ロトコルである請求項8記載の方法。
  11. 【請求項11】 無線通信プロトコルは、無線アクセス
    プロトコル(WAP)及び、携帯装置転送プロトコル
    (HDTP)よりなるグループから選択される請求項1
    0記載の方法。
  12. 【請求項12】 無線通信装置から受信された要求は、
    ユーザに特定の識別情報を有する請求項1記載の方法。
  13. 【請求項13】 ユーザに特定の識別情報は、音声認識
    サービスのための要求を処理するために、ユーザに特定
    のファイルを取り出すために使用される請求項12記載
    の方法。
  14. 【請求項14】 無線通信装置から受信された要求は、
    装置に特定の識別情報を有する請求項1記載の方法。
  15. 【請求項15】 装置に特定の識別情報は、音声認識サ
    ービスのための要求を処理するために、ユーザに特定の
    ファイルを取り出すために使用される請求項14記載の
    方法。
  16. 【請求項16】 装置に特定の識別情報は、電話番号及
    び、ユニフォームリソース識別子(URI)よりなるグ
    ループから選択される請求項14記載の方法。
  17. 【請求項17】 無線通信装置は移動電話である請求項
    1記載の方法。
  18. 【請求項18】 移動電話は、マイクロプロセッサとソ
    フトウェアの蓄積領域を有する請求項17記載の方法。
  19. 【請求項19】 マイクロプロセッサは、電話機能とロ
    ーカルアプリケーションを制御するために蓄積領域に蓄
    積されたソフトウェアを使用する請求項18記載の方
    法。
  20. 【請求項20】 ローカルアプリケーションは、音声認
    識サービスを得るのに関連する機能を提供する請求項1
    9記載の方法。
  21. 【請求項21】 表示スクリーンとユーザインターフェ
    ースを有する無線通信装置へ、音声認識サービスを提供
    する方法であって、 音声認識アプリケーションを実行しているサーバ装置に
    関する交信情報を取り出すステップと、 取り出された交信情報に関連するサーバ装置から音声認
    識サービスに関する要求を発生するステップと、 取り出された交信情報に関連するサーバ装置へ、音声認
    識サービスに関する要求を送るステップと、 無線通信装置と取り出された交信情報に関連するサーバ
    装置との間で音声通信チャネルを確立するステップと、 無線通信装置を使用しているユーザから、入力の少なく
    とも一部が音声成分を含む入力を受信するステップと、 音声認識アプリケーションにより処理するために、ユー
    ザ入力をサーバ装置へ伝送するステップとを有する方
    法。
  22. 【請求項22】 交信情報は、電話番号及び、ユニフォ
    ームリソース識別子(URI)よりなるグループから選
    択される請求項21記載の方法。
  23. 【請求項23】 音声通信チャネルは、無線ネットワー
    ク上で確立される請求項21記載の方法。
  24. 【請求項24】 無線通信ネットワークは、セルラデ
    ィジタルパケットデータ(CDPD)ネットワーク、移
    動通信のためのグローバルシステム(GSM)ネットワ
    ーク、符号分割多重(CDMA)ネットワーク、パーソ
    ナルハンディフォンシステム(PHS)及び時分割多重
    アクセス(TDMA)ネットワークよりなるグループか
    ら選択される請求項23記載の方法。
  25. 【請求項25】 取り出された交信情報に関連するサー
    バ装置から、サーバ装置によりユーザ入力の音声認識処
    理の処理された出力を有する、記号的データファイルを
    受信ステップと、 受信された記号的データファイルを、無線通信装置のロ
    ーカル資源を使用して処理するステップと、 処理された記号的データファイルの少なくとも一部を、
    再見と変更のためにユーザへ表示するステップとを更に
    有する請求項21記載の方法。
  26. 【請求項26】 受信された記号的データファイルは、
    マークアップ言語ファイルである請求項25記載の方
    法。
  27. 【請求項27】 マークアップ言語ファイルは、携帯装
    置マークアップ言語(HDML)、ハイパーテキストマ
    ークアップ言語(HTML)、コンパクトハイパーテキ
    ストマークアップ言語(cHTML)、無線マークアッ
    プ言語(WML)、標準一般化マークアップ言語(SG
    ML)及び拡張可能なマークアップ言語(XML)より
    なるグループから選択される請求項26記載の方法。
  28. 【請求項28】 記号的データファイルはバイナリーデ
    ータファイルである請求項25記載の方法。
  29. 【請求項29】 記号的データファイルはASCIIフ
    ォーマットのデータファイルである請求項25記載の方
    法。
  30. 【請求項30】 無線通信装置のための音声認識サービ
    スのための要求を発生するコンピュータプログラムコー
    ドがその上に符号化されたコンピュータ読出し可能な媒
    体であって、 音声認識サービスを提供するサーバ装置に関する交信情
    報を取り出すコンピュータプログラムコードと、 取り出された交信情報に関連するサーバ装置から音声認
    識サービスに関する要求を発生するコンピュータプログ
    ラムコードと、 無線通信装置のユーザから、音声認識サービスのための
    要求に関連している音声入力を受信するコンピュータプ
    ログラムコードと、 無線通信装置と、音声信号を音声認識処理のためのサー
    バ装置へ伝送する目的のサーバ装置との間で音声通信セ
    ッションを確立するコンピュータプログラムコードとを
    有するコンピュータ読出し可能な媒体。
  31. 【請求項31】 交信情報は、電話番号及び、ユニフォ
    ームリソース識別子(URI)よりなるグループから選
    択される請求項30記載のコンピュータ読出し可能な媒
    体。
  32. 【請求項32】 無線通信装置へ音声認識サービスを提
    供するコンピュータプログラムコードがその上に符号化
    されたコンピュータ読出し可能な媒体であって、 移動装置から受信した音声認識サービスのための要求を
    処理するためのコンピュータプログラムコードと、 音声認識サービスのための要求に関連する音声認識を受
    信するためのコンピュータプログラムコードと、 受信された音声入力を記号的データファイルへ変換する
    ためのコンピュータプログラムコードと、 記号的データファイルを、要求を発した移動装置へ送る
    ためのコンピュータプログラムコードとを有するコンピ
    ュータ読出し可能な媒体。
  33. 【請求項33】 記号的データファイルはマークアップ
    言語ファイルである請求項32記載のコンピュータ読出
    し可能な媒体。
  34. 【請求項34】 マークアップ言語ファイルは、携帯装
    置マークアップ言語(HDML)、ハイパーテキストマ
    ークアップ言語(HTML)、コンパクトハイパーテキ
    ストマークアップ言語(cHTML)、無線マークアッ
    プ言語(WML)、標準一般化マークアップ言語(SG
    ML)及び拡張可能なマークアップ言語(XML)より
    なるグループから選択される請求項33記載のコンピュ
    ータ読出し可能な媒体。
  35. 【請求項35】 要求に関連するユーザに特定のファイ
    ルを取り出すためのコンピュータプログラムコードと、 音声入力を記号的データファイルへ変換する変換処理中
    に、ユーザに特定のファイルを利用するコンピュータプ
    ログラムコードとを更に有する請求項32記載のコンピ
    ュータ読出し可能な媒体。
  36. 【請求項36】 ユーザに特定のファイルはユーザの嗜
    好を含む請求項35記載のコンピュータ読出し可能な媒
    体。
  37. 【請求項37】 ユーザに特定のファイルはユーザの音
    声テンプレートを含む請求項35記載のコンピュータ読
    出し可能な媒体。
  38. 【請求項38】 音声認識サービスを提供する無線通信
    システムであって、 第1の通信経路で音声認識処理のための音声入力を提供
    し且つ、第2の通信経路で処理された音声入力を表す記
    号的データファイルを受信する無線通信装置と、 第1の通信経路で無線通信装置からの音声入力信号受信
    し、受信した音声入力信号を、記号的なデータファイル
    へ変換し、第2の通信経路を使用して、記号的データフ
    ァイルを無線通信装置へ送る音声認識アプリケーション
    を実行しているサーバ装置を有するシステム。
  39. 【請求項39】 第1の通信経路は、無線通信ネットワ
    ーク上で確立される請求項38記載の無線通信システ
    ム。
  40. 【請求項40】 無線通信ネットワークは、セルラディ
    ジタルパケットデータ(CDPD)ネットワーク、移動
    通信のためのグローバルシステム(GSM)ネットワー
    ク、符号分割多重(CDMA)ネットワーク、パーソナ
    ルハンディフォンシステム(PHS)及び時分割多重ア
    クセス(TDMA)ネットワークよりなるグループから
    選択される請求項39記載の無線通信システム。
  41. 【請求項41】 第2の通信経路は、第1の通信プロト
    コルを使用する有線ネットワークにより音声認識アプリ
    ケーションを実行しているサーバ装置と、第2の通信プ
    ロトコルを使用して無線ネットワークにより無線通信装
    置に接続されたリンクサーバ装置を有する請求項40記
    載の無線通信システム。
  42. 【請求項42】 第1の通信プロトコルは、転送制御プ
    ロトコル/インターネットプロトコル(TCP/I
    P)、ハイパーテキスト転送プロトコル(HTTP)、
    安全ハイパーテキスト転送プロトコル(sHTTP)よ
    りなるグループから選択される請求項41記載の無線通
    信システム。
  43. 【請求項43】 第2の通信プロトコルは、無線通信プ
    ロトコルである請求項41記載の無線通信システム。
  44. 【請求項44】 無線通信プロトコルは、無線アクセス
    プロトコル(WAP)及び、携帯装置転送プロトコル
    (HDTP)よりなるグループから選択される請求項4
    3記載の無線通信システム。
  45. 【請求項45】 無線通信装置は移動電話である請求項
    38記載の無線通信システム。
  46. 【請求項46】 移動電話は、マイクロプロセッサとソ
    フトウェアの蓄積領域を有する請求項45記載の無線通
    信システム。
  47. 【請求項47】 マイクロプロセッサは、電話機能とロ
    ーカルアプリケーションを制御するために蓄積領域に蓄
    積されたソフトウェアを使用する請求項46記載の無線
    通信システム。
  48. 【請求項48】 ローカルアプリケーションは、音声認
    識サービスを得るのに関連する機能を提供する請求項4
    7記載の無線通信システム。
JP2000356405A 1999-11-24 2000-11-22 無線通信装置のためのユーザインターフェースに基づく音声認識 Pending JP2001222294A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US167290 1988-03-11
US16729099P 1999-11-24 1999-11-24
US643558 2000-08-21
US09/643,558 US6532446B1 (en) 1999-11-24 2000-08-21 Server based speech recognition user interface for wireless devices

Publications (1)

Publication Number Publication Date
JP2001222294A true JP2001222294A (ja) 2001-08-17

Family

ID=26863029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000356405A Pending JP2001222294A (ja) 1999-11-24 2000-11-22 無線通信装置のためのユーザインターフェースに基づく音声認識

Country Status (5)

Country Link
US (1) US6532446B1 (ja)
EP (1) EP1104155A3 (ja)
JP (1) JP2001222294A (ja)
KR (1) KR20010051903A (ja)
CN (1) CN1298249A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020024045A (ko) * 2002-01-22 2002-03-29 배성윤 셀룰러폰을 이용한 외국어 회화학습과 통역지원 시스템
JP2005530279A (ja) * 2002-07-02 2005-10-06 テレフオンアクチーボラゲット エル エム エリクソン(パブル) インターネットコンテンツのアクセスに関するシステム及び方法

Families Citing this family (363)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6630800A (en) * 1999-08-13 2001-03-13 Pixo, Inc. Methods and apparatuses for display and traversing of links in page character array
US7203721B1 (en) * 1999-10-08 2007-04-10 At Road, Inc. Portable browser device with voice recognition and feedback capability
JP2001197379A (ja) * 2000-01-05 2001-07-19 Matsushita Electric Ind Co Ltd 機器設定装置、機器設定システムおよび機器設定処理プログラムを記録した記録媒体
JP3452250B2 (ja) * 2000-03-15 2003-09-29 日本電気株式会社 無線携帯端末通信システム
US8645137B2 (en) * 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8355912B1 (en) * 2000-05-04 2013-01-15 International Business Machines Corporation Technique for providing continuous speech recognition as an alternate input device to limited processing power devices
US7134073B1 (en) * 2000-06-15 2006-11-07 International Business Machines Corporation Apparatus and method for enabling composite style sheet application to multi-part electronic documents
JP2002074188A (ja) * 2000-06-16 2002-03-15 Sony Computer Entertainment Inc 会員情報登録方法および装置、会員認証方法および装置、サーバコンピュータ
DE60133902D1 (ja) * 2000-07-28 2008-06-19 Siemens Vdo Automotive Corp
US7114077B2 (en) * 2000-08-23 2006-09-26 Ryan Miller Verification system for confidential data input
FI20001918A (fi) 2000-08-30 2002-03-01 Nokia Corp Monimodaalinen sisältö ja automaattinen puheen tunnistus langattomassa tietoliikennejärjestelmässä
JP2002073561A (ja) * 2000-09-01 2002-03-12 Toyota Motor Corp 通信網を介してアクセスするユーザの認証方法及び認証システム、並びに、これらを利用した情報処理システム
US8165867B1 (en) * 2000-09-15 2012-04-24 Fish Robert D Methods for translating a device command
US20110238855A1 (en) * 2000-09-25 2011-09-29 Yevgeny Korsunsky Processing data flows with a data flow processor
US20110213869A1 (en) * 2000-09-25 2011-09-01 Yevgeny Korsunsky Processing data flows with a data flow processor
US20110231564A1 (en) * 2000-09-25 2011-09-22 Yevgeny Korsunsky Processing data flows with a data flow processor
US9800608B2 (en) * 2000-09-25 2017-10-24 Symantec Corporation Processing data flows with a data flow processor
US20070192863A1 (en) * 2005-07-01 2007-08-16 Harsh Kapoor Systems and methods for processing data flows
JP4135307B2 (ja) * 2000-10-17 2008-08-20 株式会社日立製作所 音声通訳サービス方法および音声通訳サーバ
US7181508B1 (en) * 2000-11-09 2007-02-20 Oki Data Americas, Inc. System and method for communicating, monitoring and configuring a device operatively connected to a network
US7496510B2 (en) * 2000-11-30 2009-02-24 International Business Machines Corporation Method and apparatus for the automatic separating and indexing of multi-speaker conversations
US20020097692A1 (en) * 2000-12-29 2002-07-25 Nokia Mobile Phones Ltd. User interface for a mobile station
GB0108044D0 (en) * 2001-03-30 2001-05-23 British Telecomm Application synchronisation
US20020178003A1 (en) * 2001-03-09 2002-11-28 Motorola, Inc. Method and apparatus for providing voice recognition service to a wireless communication device
AU2002251205A1 (en) * 2001-03-30 2002-10-15 British Telecommunications Public Limited Company Multi-modal interface
US6832196B2 (en) * 2001-03-30 2004-12-14 International Business Machines Corporation Speech driven data selection in a voice-enabled program
KR100414064B1 (ko) * 2001-04-12 2004-01-07 엘지전자 주식회사 음성인식에 의한 이동통신 단말기 제어시스템 및 방법
US6931463B2 (en) * 2001-09-11 2005-08-16 International Business Machines Corporation Portable companion device only functioning when a wireless link established between the companion device and an electronic device and providing processed data to the electronic device
US6901364B2 (en) * 2001-09-13 2005-05-31 Matsushita Electric Industrial Co., Ltd. Focused language models for improved speech input of structured documents
US6865532B2 (en) * 2001-09-19 2005-03-08 Mitsubishi Electric Research Laboratories, Inc. Method for recognizing spoken identifiers having predefined grammars
US7158499B2 (en) * 2001-09-19 2007-01-02 Mitsubishi Electric Research Laboratories, Inc. Voice-operated two-way asynchronous radio
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
GB2382749B (en) * 2001-11-28 2005-12-07 Nokia Mobile Developments Call routing
US20030125959A1 (en) * 2001-12-31 2003-07-03 Palmquist Robert D. Translation device with planar microphone array
AU2003207495A1 (en) 2002-01-08 2003-07-24 Seven Networks, Inc. Connection architecture for a mobile network
US20030157959A1 (en) * 2002-01-11 2003-08-21 Jakke Makela Method, system, apparatus and computer program product for portable networking of multi-user applications
US7286993B2 (en) * 2002-01-31 2007-10-23 Product Discovery, Inc. Holographic speech translation system and method
FR2835999B1 (fr) * 2002-02-13 2004-04-02 France Telecom Edition et consultation de services vocaux telephoniques interactifs
CA2480663A1 (en) * 2002-03-28 2003-10-09 British Telecommunications Public Limited Company Synchronisation in multi-modal interfaces
JP2003308283A (ja) * 2002-04-18 2003-10-31 Mitsubishi Electric Corp 通信装置、通信方法及び車載用ナビゲーション装置
US7376701B2 (en) * 2002-04-29 2008-05-20 Cisco Technology, Inc. System and methodology for control of, and access and response to internet email from a wireless device
US7509117B2 (en) * 2002-05-31 2009-03-24 Nokia Corporation Apparatus, and associated method, for notifying a user in a radio communication system of a commercially-related transaction
KR20030097347A (ko) * 2002-06-20 2003-12-31 삼성전자주식회사 휴대용 단말기의 음성인식을 이용한 문자메시지 전송 방법
WO2004008434A1 (en) * 2002-07-17 2004-01-22 Nokia Corporation Mobile device having voice user interface, and a methode for testing the compatibility of an application with the mobile device
US7421390B2 (en) 2002-09-13 2008-09-02 Sun Microsystems, Inc. Method and system for voice control of software applications
US20040107250A1 (en) * 2002-10-21 2004-06-03 Guillermo Marciano Methods and systems for integrating communication resources using the internet
US7873390B2 (en) 2002-12-09 2011-01-18 Voice Signal Technologies, Inc. Provider-activated software for mobile communication devices
US8468126B2 (en) 2005-08-01 2013-06-18 Seven Networks, Inc. Publishing data in an information community
US7853563B2 (en) 2005-08-01 2010-12-14 Seven Networks, Inc. Universal data aggregation
US7917468B2 (en) 2005-08-01 2011-03-29 Seven Networks, Inc. Linking of personal information management data
AU2003214512A1 (en) * 2003-04-07 2004-11-01 Nokia Corporation Method and device for providing speech-enabled input in an electronic device having a user interface
US7669134B1 (en) 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
ATE339757T1 (de) * 2003-06-17 2006-10-15 Sony Ericsson Mobile Comm Ab Verfahren und vorrichtung zur sprachaktivitätsdetektion
US7089604B2 (en) * 2003-11-05 2006-08-15 Wright Glenn H Toilet support device and method
DE10353068A1 (de) * 2003-11-13 2005-06-23 Voice Trust Ag Verfahren zur Authentifizierung eines Benutzers anhand dessen Stimmprofils
EP1687961A2 (en) * 2003-11-14 2006-08-09 Voice Signal Technologies Inc. Installing language modules in a mobile communication device
FI115274B (fi) * 2003-12-19 2005-03-31 Nokia Corp Puhekäyttöliittymällä varustettu elektroninen laite ja menetelmä elektronisessa laitteessa käyttöliittymäkieliasetuksien suorittamiseksi
US20050171781A1 (en) * 2004-01-08 2005-08-04 Poploskie Jon M. Speech information system
US8954325B1 (en) * 2004-03-22 2015-02-10 Rockstar Consortium Us Lp Speech recognition in automated information services systems
US20060009974A1 (en) * 2004-07-09 2006-01-12 Matsushita Electric Industrial Co., Ltd. Hands-free voice dialing for portable and remote devices
US8010082B2 (en) 2004-10-20 2011-08-30 Seven Networks, Inc. Flexible billing architecture
US7441271B2 (en) 2004-10-20 2008-10-21 Seven Networks Method and apparatus for intercepting events in a communication system
US7706781B2 (en) 2004-11-22 2010-04-27 Seven Networks International Oy Data security in a mobile e-mail service
FI117152B (fi) 2004-12-03 2006-06-30 Seven Networks Internat Oy Sähköpostiasetusten käyttöönotto matkaviestimelle
US7529677B1 (en) 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
EP1686565B1 (en) * 2005-01-31 2007-05-02 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited speech data
US7877703B1 (en) 2005-03-14 2011-01-25 Seven Networks, Inc. Intelligent rendering of information in a limited display environment
US8438633B1 (en) 2005-04-21 2013-05-07 Seven Networks, Inc. Flexible real-time inbox access
US7796742B1 (en) 2005-04-21 2010-09-14 Seven Networks, Inc. Systems and methods for simplified provisioning
WO2006136660A1 (en) 2005-06-21 2006-12-28 Seven Networks International Oy Maintaining an ip connection in a mobile network
US8069166B2 (en) 2005-08-01 2011-11-29 Seven Networks, Inc. Managing user-to-user contact with inferred presence information
US20070038455A1 (en) * 2005-08-09 2007-02-15 Murzina Marina V Accent detection and correction system
US8677377B2 (en) * 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8635073B2 (en) * 2005-09-14 2014-01-21 At&T Intellectual Property I, L.P. Wireless multimodal voice browser for wireline-based IPTV services
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
CN1953447B (zh) * 2005-10-21 2010-09-15 华为技术有限公司 媒体资源处理方法
CN100426377C (zh) * 2005-10-21 2008-10-15 华为技术有限公司 一种实现语音识别功能的方法
US20070112571A1 (en) * 2005-11-11 2007-05-17 Murugappan Thirugnana Speech recognition at a mobile terminal
CA2634032A1 (en) * 2005-12-15 2007-06-21 Josef Berger System and methods for initiating, maintaining, and delivering personalized information by communication server
US7769395B2 (en) 2006-06-20 2010-08-03 Seven Networks, Inc. Location-based operations and messaging
US8370141B2 (en) * 2006-03-03 2013-02-05 Reagan Inventions, Llc Device, system and method for enabling speech recognition on a portable data device
US7761293B2 (en) * 2006-03-06 2010-07-20 Tran Bao Q Spoken mobile engine
US8510109B2 (en) * 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
WO2007117626A2 (en) 2006-04-05 2007-10-18 Yap, Inc. Hosted voice recognition system for wireless devices
US9436951B1 (en) 2007-08-22 2016-09-06 Amazon Technologies, Inc. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
US20090124272A1 (en) 2006-04-05 2009-05-14 Marc White Filtering transcriptions of utterances
US9123343B2 (en) * 2006-04-27 2015-09-01 Mobiter Dicta Oy Method, and a device for converting speech by replacing inarticulate portions of the speech before the conversion
US8204748B2 (en) * 2006-05-02 2012-06-19 Xerox Corporation System and method for providing a textual representation of an audio message to a mobile device
US9208785B2 (en) * 2006-05-10 2015-12-08 Nuance Communications, Inc. Synchronizing distributed speech recognition
US9086737B2 (en) * 2006-06-15 2015-07-21 Apple Inc. Dynamically controlled keyboard
US20080031475A1 (en) 2006-07-08 2008-02-07 Personics Holdings Inc. Personal audio assistant device and method
US11450331B2 (en) 2006-07-08 2022-09-20 Staton Techiya, Llc Personal audio assistant device and method
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8386259B2 (en) 2006-12-28 2013-02-26 Intel Corporation Voice interface to NFC applications
US7912828B2 (en) * 2007-02-23 2011-03-22 Apple Inc. Pattern searching methods and apparatuses
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8949130B2 (en) 2007-03-07 2015-02-03 Vlingo Corporation Internal and external speech recognition use with a mobile communication facility
US20080221901A1 (en) * 2007-03-07 2008-09-11 Joseph Cerra Mobile general search environment speech processing facility
US8949266B2 (en) * 2007-03-07 2015-02-03 Vlingo Corporation Multiple web-based content category searching in mobile search application
US8838457B2 (en) * 2007-03-07 2014-09-16 Vlingo Corporation Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
US8635243B2 (en) * 2007-03-07 2014-01-21 Research In Motion Limited Sending a communications header with voice recording to send metadata for use in speech recognition, formatting, and search mobile search application
US20090030691A1 (en) * 2007-03-07 2009-01-29 Cerra Joseph P Using an unstructured language model associated with an application of a mobile communication facility
US8996379B2 (en) * 2007-03-07 2015-03-31 Vlingo Corporation Speech recognition text entry for software applications
US10056077B2 (en) 2007-03-07 2018-08-21 Nuance Communications, Inc. Using speech recognition results based on an unstructured language model with a music system
US8886540B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Using speech recognition results based on an unstructured language model in a mobile communication facility application
US8515728B2 (en) * 2007-03-29 2013-08-20 Microsoft Corporation Language translation of visual and audio input
US8977255B2 (en) * 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20090076917A1 (en) * 2007-08-22 2009-03-19 Victor Roditis Jablokov Facilitating presentation of ads relating to words of a message
US8352264B2 (en) * 2008-03-19 2013-01-08 Canyon IP Holdings, LLC Corrective feedback loop for automated speech recognition
US8352261B2 (en) * 2008-03-07 2013-01-08 Canyon IP Holdings, LLC Use of intermediate speech transcription results in editing final speech transcription results
US9973450B2 (en) * 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
US8326636B2 (en) 2008-01-16 2012-12-04 Canyon Ip Holdings Llc Using a physical phenomenon detector to control operation of a speech recognition engine
US8611871B2 (en) 2007-12-25 2013-12-17 Canyon Ip Holdings Llc Validation of mobile advertising from derived information
US8805425B2 (en) 2007-06-01 2014-08-12 Seven Networks, Inc. Integrated messaging
US8693494B2 (en) 2007-06-01 2014-04-08 Seven Networks, Inc. Polling
US20100169003A1 (en) * 2007-06-04 2010-07-01 Sander Van Der Meer Location data processing apparatus and method of importing location information
US9053489B2 (en) 2007-08-22 2015-06-09 Canyon Ip Holdings Llc Facilitating presentation of ads relating to words of a message
US8335830B2 (en) * 2007-08-22 2012-12-18 Canyon IP Holdings, LLC. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
US20090070109A1 (en) * 2007-09-12 2009-03-12 Microsoft Corporation Speech-to-Text Transcription for Personal Communication Devices
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8065152B2 (en) * 2007-11-08 2011-11-22 Demand Media, Inc. Platform for enabling voice commands to resolve phoneme based domain name registrations
US8620662B2 (en) * 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
US8364181B2 (en) 2007-12-10 2013-01-29 Seven Networks, Inc. Electronic-mail filtering for mobile devices
US9002828B2 (en) 2007-12-13 2015-04-07 Seven Networks, Inc. Predictive content delivery
US8793305B2 (en) 2007-12-13 2014-07-29 Seven Networks, Inc. Content delivery to a mobile device from a content service
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US8067701B2 (en) * 2008-01-07 2011-11-29 Apple Inc. I/O connectors with extendable faraday cage
US8107921B2 (en) 2008-01-11 2012-01-31 Seven Networks, Inc. Mobile virtual network operator
US8862657B2 (en) 2008-01-25 2014-10-14 Seven Networks, Inc. Policy based content service
US20090193338A1 (en) 2008-01-28 2009-07-30 Trevor Fiatal Reducing network and battery consumption during content delivery and playback
US8065143B2 (en) * 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
CN102016975A (zh) 2008-03-28 2011-04-13 寇平公司 适合用作移动式互联网装置的具有高分辨率显示器的手持式无线显示装置
US8676577B2 (en) * 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US8787947B2 (en) 2008-06-18 2014-07-22 Seven Networks, Inc. Application discovery on mobile devices
US8078158B2 (en) 2008-06-26 2011-12-13 Seven Networks, Inc. Provisioning applications for a mobile device
US8700008B2 (en) 2008-06-27 2014-04-15 Microsoft Corporation Providing data service options in push-to-talk using voice recognition
US9128981B1 (en) 2008-07-29 2015-09-08 James L. Geer Phone assisted ‘photographic memory’
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8110744B2 (en) * 2008-08-19 2012-02-07 Apple Inc. Flexible shielded cable
US8301454B2 (en) 2008-08-22 2012-10-30 Canyon Ip Holdings Llc Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US9129291B2 (en) 2008-09-22 2015-09-08 Personics Holdings, Llc Personalized sound management and method
US20100082328A1 (en) * 2008-09-29 2010-04-01 Apple Inc. Systems and methods for speech preprocessing in text to speech synthesis
US8355919B2 (en) * 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8352268B2 (en) * 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8352272B2 (en) * 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8396714B2 (en) * 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8909759B2 (en) 2008-10-10 2014-12-09 Seven Networks, Inc. Bandwidth measurement
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
WO2010075623A1 (en) * 2008-12-31 2010-07-08 Bce Inc. System and method for unlocking a device
US8380507B2 (en) * 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US20110010179A1 (en) * 2009-07-13 2011-01-13 Naik Devang K Voice synthesis and processing
US20110111800A1 (en) * 2009-11-11 2011-05-12 Temar Harper Cellular Phone Memory Card With Voice Activated Component
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US20110110534A1 (en) * 2009-11-12 2011-05-12 Apple Inc. Adjustable voice output based on device status
US9875671B2 (en) * 2009-12-17 2018-01-23 Google Llc Cloud-based user interface augmentation
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
TW201209697A (en) 2010-03-30 2012-03-01 Michael Luna 3D mobile user interface with configurable workspace management
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US8838783B2 (en) 2010-07-26 2014-09-16 Seven Networks, Inc. Distributed caching for resource and mobile network traffic management
CA2806548C (en) 2010-07-26 2015-03-31 Seven Networks, Inc. Distributed implementation of dynamic wireless traffic policy
CA2806557C (en) 2010-07-26 2014-10-07 Michael Luna Mobile application traffic optimization
EP2599003B1 (en) 2010-07-26 2018-07-11 Seven Networks, LLC Mobile network traffic coordination across multiple applications
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US10013976B2 (en) 2010-09-20 2018-07-03 Kopin Corporation Context sensitive overlays in voice controlled headset computer displays
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
US8166164B1 (en) 2010-11-01 2012-04-24 Seven Networks, Inc. Application and network-based long poll request detection and cacheability assessment therefor
WO2012060995A2 (en) 2010-11-01 2012-05-10 Michael Luna Distributed caching in a wireless network of content delivered for a mobile application over a long-held request
WO2012061437A1 (en) 2010-11-01 2012-05-10 Michael Luna Cache defeat detection and caching of content addressed by identifiers intended to defeat cache
EP2635973A4 (en) 2010-11-01 2014-01-15 Seven Networks Inc TO THE BEHAVIOR OF A MOBILE APPLICATION AND INTERMEDIATE STORAGE TAILORED TO NETWORK CONDITIONS
US9330196B2 (en) 2010-11-01 2016-05-03 Seven Networks, Llc Wireless traffic management system cache optimization using http headers
US8326985B2 (en) 2010-11-01 2012-12-04 Seven Networks, Inc. Distributed management of keep-alive message signaling for mobile network resource conservation and optimization
US8484314B2 (en) 2010-11-01 2013-07-09 Seven Networks, Inc. Distributed caching in a wireless network of content delivered for a mobile application over a long-held request
US8843153B2 (en) 2010-11-01 2014-09-23 Seven Networks, Inc. Mobile traffic categorization and policy for network use optimization while preserving user experience
US9060032B2 (en) 2010-11-01 2015-06-16 Seven Networks, Inc. Selective data compression by a distributed traffic management system to reduce mobile data traffic and signaling traffic
EP2636268B1 (en) 2010-11-22 2019-02-27 Seven Networks, LLC Optimization of resource polling intervals to satisfy mobile device requests
EP2596658B1 (en) 2010-11-22 2018-05-09 Seven Networks, LLC Aligning data transfer to optimize connections established for transmission over a wireless network
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8818797B2 (en) * 2010-12-23 2014-08-26 Microsoft Corporation Dual-band speech encoding
EP2661697B1 (en) 2011-01-07 2018-11-21 Seven Networks, LLC System and method for reduction of mobile network traffic used for domain name system (dns) queries
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
WO2012145544A2 (en) 2011-04-19 2012-10-26 Seven Networks, Inc. Device resource sharing for network resource conservation
WO2012149221A2 (en) 2011-04-27 2012-11-01 Seven Networks, Inc. System and method for making requests on behalf of a mobile device based on atomic processes for mobile network traffic relief
US8621075B2 (en) 2011-04-27 2013-12-31 Seven Metworks, Inc. Detecting and preserving state for satisfying application requests in a distributed proxy and cache system
WO2012154938A1 (en) 2011-05-10 2012-11-15 Kopin Corporation Headset computer that uses motion and voice commands to control information display and remote devices
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
EP2737741A4 (en) 2011-07-27 2015-01-21 Seven Networks Inc SURVEILLANCE OF MOBILE APPLICATION ACTIVITIES IN SEARCH OF MALICIOUS TRAFFIC ON A MOBILE DEVICE
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
CN102496364A (zh) * 2011-11-30 2012-06-13 苏州奇可思信息科技有限公司 基于云端网络的交互式语音识别方法
WO2013086225A1 (en) 2011-12-06 2013-06-13 Seven Networks, Inc. A mobile device and method to utilize the failover mechanisms for fault tolerance provided for mobile traffic management and network/device resource conservation
US8918503B2 (en) 2011-12-06 2014-12-23 Seven Networks, Inc. Optimization of mobile traffic directed to private networks and operator configurability thereof
US9277443B2 (en) 2011-12-07 2016-03-01 Seven Networks, Llc Radio-awareness of mobile device for sending server-side control signals using a wireless network optimized transport protocol
US9208123B2 (en) 2011-12-07 2015-12-08 Seven Networks, Llc Mobile device having content caching mechanisms integrated with a network operator for traffic alleviation in a wireless network and methods therefor
US20130159511A1 (en) 2011-12-14 2013-06-20 Seven Networks, Inc. System and method for generating a report to a network operator by distributing aggregation of data
US8861354B2 (en) 2011-12-14 2014-10-14 Seven Networks, Inc. Hierarchies and categories for management and deployment of policies for distributed wireless traffic optimization
WO2013090834A1 (en) 2011-12-14 2013-06-20 Seven Networks, Inc. Operation modes for mobile traffic optimization and concurrent management of optimized and non-optimized traffic
EP2801236A4 (en) 2012-01-05 2015-10-21 Seven Networks Inc DETECTION AND MANAGEMENT OF USER INTERACTIONS WITH FRONT PANEL APPLICATIONS ON A MOBILE DEVICE IN DISTRIBUTED CACHE STORES
WO2013116856A1 (en) 2012-02-02 2013-08-08 Seven Networks, Inc. Dynamic categorization of applications for network access in a mobile network
WO2013116852A1 (en) 2012-02-03 2013-08-08 Seven Networks, Inc. User as an end point for profiling and optimizing the delivery of content and data in a wireless network
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US8812695B2 (en) 2012-04-09 2014-08-19 Seven Networks, Inc. Method and system for management of a virtual network connection without heartbeat messages
US20130268656A1 (en) 2012-04-10 2013-10-10 Seven Networks, Inc. Intelligent customer service/call center services enhanced using real-time and historical mobile application and traffic-related statistics collected by a distributed caching system in a mobile network
WO2013163293A1 (en) * 2012-04-25 2013-10-31 Kopin Corporation Instant translation system
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9576572B2 (en) 2012-06-18 2017-02-21 Telefonaktiebolaget Lm Ericsson (Publ) Methods and nodes for enabling and producing input to an application
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
WO2014011216A1 (en) 2012-07-13 2014-01-16 Seven Networks, Inc. Dynamic bandwidth adjustment for browsing or streaming activity in a wireless network based on prediction of user behavior when interacting with mobile applications
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
US9161258B2 (en) 2012-10-24 2015-10-13 Seven Networks, Llc Optimized and selective management of policy deployment to mobile clients in a congested network to prevent further aggravation of network congestion
US20140177497A1 (en) 2012-12-20 2014-06-26 Seven Networks, Inc. Management of mobile device radio state promotion and demotion
WO2014094859A1 (en) 2012-12-20 2014-06-26 Widex A/S Hearing aid and a method for audio streaming
CN103177557B (zh) * 2012-12-28 2016-05-11 吴玉胜 基于智能设备的家电控制方法及系统
US9922639B1 (en) 2013-01-11 2018-03-20 Amazon Technologies, Inc. User feedback for speech interactions
US9241314B2 (en) 2013-01-23 2016-01-19 Seven Networks, Llc Mobile device with application or context aware fast dormancy
US8874761B2 (en) 2013-01-25 2014-10-28 Seven Networks, Inc. Signaling optimization in a wireless network for traffic utilizing proprietary and non-proprietary protocols
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9326185B2 (en) 2013-03-11 2016-04-26 Seven Networks, Llc Mobile network congestion recognition for optimization of mobile traffic
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
CN105144133B (zh) 2013-03-15 2020-11-20 苹果公司 对中断进行上下文相关处理
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
CN110096712B (zh) 2013-03-15 2023-06-20 苹果公司 通过智能数字助理的用户培训
US20140297709A1 (en) * 2013-03-27 2014-10-02 Xiaomi Inc. Method and mobile terminal for creating a contact
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
US9065765B2 (en) 2013-07-22 2015-06-23 Seven Networks, Inc. Proxy server associated with a mobile carrier for enhancing mobile traffic management in a mobile network
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
KR102155482B1 (ko) * 2013-10-15 2020-09-14 삼성전자 주식회사 디스플레이장치 및 그 제어방법
CN103617795A (zh) * 2013-10-31 2014-03-05 广东好帮手电子科技股份有限公司 一种车载语音识别控制方法及系统
KR102345611B1 (ko) * 2013-11-18 2021-12-31 삼성전자주식회사 디스플레이 장치 및 제어 방법
US9449602B2 (en) * 2013-12-03 2016-09-20 Google Inc. Dual uplink pre-processing paths for machine and human listening
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
KR102225404B1 (ko) * 2014-05-23 2021-03-09 삼성전자주식회사 디바이스 정보를 이용하는 음성인식 방법 및 장치
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9741344B2 (en) * 2014-10-20 2017-08-22 Vocalzoom Systems Ltd. System and method for operating devices using voice commands
EP3220372B1 (en) * 2014-11-12 2019-10-16 Fujitsu Limited Wearable device, display control method, and display control program
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
TWI621340B (zh) * 2015-02-26 2018-04-11 默科資訊股份有限公司 偵測空氣波動的控制系統與其控制方法
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9953631B1 (en) 2015-05-07 2018-04-24 Google Llc Automatic speech recognition techniques for multiple languages
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
KR101642918B1 (ko) * 2015-08-03 2016-07-27 서치콘주식회사 코드네임 프로토콜을 이용한 네트워크 접속 제어 방법, 이를 수행하는 네트워크 접속 제어 서버 및 이를 저장하는 기록매체
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DE102015222956A1 (de) * 2015-11-20 2017-05-24 Robert Bosch Gmbh Verfahren zum Betreiben eines Serversystems und zum Betreiben eines Aufnahmegeräts zum Aufnehmen eines Sprachbefehls, Serversystem, Aufnahmegerät und Sprachdialogsystem
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10560974B2 (en) 2016-09-11 2020-02-11 Lg Electronics Inc. Method and apparatus for connecting device by using Bluetooth technology
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
KR20180101926A (ko) * 2017-03-06 2018-09-14 삼성전자주식회사 전자 장치 및 전자 장치의 어플리케이션 제어 방법
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN107342083B (zh) * 2017-07-05 2021-07-20 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
US10586537B2 (en) * 2017-11-30 2020-03-10 International Business Machines Corporation Filtering directive invoking vocal utterances
CN109508171A (zh) * 2018-12-19 2019-03-22 上海龙旗科技股份有限公司 一种基于四通道的语音处理方法及设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0637711A (ja) * 1992-07-20 1994-02-10 Nec Corp 自動車電話機
US5335276A (en) * 1992-12-16 1994-08-02 Texas Instruments Incorporated Communication system and methods for enhanced information transfer
ZA948426B (en) 1993-12-22 1995-06-30 Qualcomm Inc Distributed voice recognition system
US5651056A (en) * 1995-07-13 1997-07-22 Eting; Leon Apparatus and methods for conveying telephone numbers and other information via communication devices
US6456974B1 (en) 1997-01-06 2002-09-24 Texas Instruments Incorporated System and method for adding speech recognition capabilities to java
US5928325A (en) * 1997-02-24 1999-07-27 Motorola, Inc. Method of dynamically establishing communication of incoming messages to one or more user devices presently available to an intended recipient
GB2323693B (en) 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
USH1895H (en) * 1997-09-26 2000-10-03 Dsc/Celcore, Inc. Application provider and method for communication
US6167251A (en) * 1998-10-02 2000-12-26 Telespree Communications Keyless portable cellular phone system having remote voice recognition
US6351523B1 (en) * 1999-03-22 2002-02-26 Sharp Laboratories Of America, Inc. Method and apparatus for management of EMail originated by thin client devices
JP3452250B2 (ja) * 2000-03-15 2003-09-29 日本電気株式会社 無線携帯端末通信システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020024045A (ko) * 2002-01-22 2002-03-29 배성윤 셀룰러폰을 이용한 외국어 회화학습과 통역지원 시스템
JP2005530279A (ja) * 2002-07-02 2005-10-06 テレフオンアクチーボラゲット エル エム エリクソン(パブル) インターネットコンテンツのアクセスに関するシステム及び方法

Also Published As

Publication number Publication date
CN1298249A (zh) 2001-06-06
EP1104155A3 (en) 2002-11-27
US6532446B1 (en) 2003-03-11
EP1104155A2 (en) 2001-05-30
KR20010051903A (ko) 2001-06-25

Similar Documents

Publication Publication Date Title
JP2001222294A (ja) 無線通信装置のためのユーザインターフェースに基づく音声認識
US6594347B1 (en) Speech encoding in a client server system
US7382770B2 (en) Multi-modal content and automatic speech recognition in wireless telecommunication systems
US7254384B2 (en) Multi-modal messaging
US6424945B1 (en) Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
US7421390B2 (en) Method and system for voice control of software applications
US7151763B2 (en) Retrieving voice-based content in conjunction with wireless application protocol browsing
US7003463B1 (en) System and method for providing network coordinated conversational services
JP2002528804A (ja) サービスアプリケーションに対するユーザインタフェースの音声制御
US20050138131A1 (en) Method and system for creating pervasive computing environments
MXPA04010107A (es) Entrada multimodal secuencial.
WO2003063137A1 (en) Multi-modal information delivery system
WO2004006131A1 (en) An arrangement and a method relating to access to internet content
US20060100881A1 (en) Multi-modal web interaction over wireless network
US20070143307A1 (en) Communication system employing a context engine
WO2000021075A1 (en) System and method for providing network coordinated conversational services
WO2003083725A1 (en) Method and apparatus for multimodal communication with user control of delivery modality
US20020174177A1 (en) Voice activated navigation of a computer network
KR20010076464A (ko) 음성을 통한 인터넷 서비스 시스템
US7062297B2 (en) Method and system for accessing a network using voice recognition
US20020077814A1 (en) Voice recognition system method and apparatus
KR100486030B1 (ko) 음성인식을 이용한 이동통신 단말기의 인터넷 사이트접속장치 및 방법
JPH10164249A (ja) 情報処理装置
KR100793024B1 (ko) Sms를 이용한 학습 시스템 및 그 방법
Tsai et al. WWW and telecommunication collaboration service for Mandarin automatic personal phone book inquire dialogue system