JPH0863330A - 音声入力装置 - Google Patents

音声入力装置

Info

Publication number
JPH0863330A
JPH0863330A JP6193418A JP19341894A JPH0863330A JP H0863330 A JPH0863330 A JP H0863330A JP 6193418 A JP6193418 A JP 6193418A JP 19341894 A JP19341894 A JP 19341894A JP H0863330 A JPH0863330 A JP H0863330A
Authority
JP
Japan
Prior art keywords
voice
input
unit
input device
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6193418A
Other languages
English (en)
Other versions
JP3586777B2 (ja
Inventor
Nobuyuki Washio
信之 鷲尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP19341894A priority Critical patent/JP3586777B2/ja
Publication of JPH0863330A publication Critical patent/JPH0863330A/ja
Application granted granted Critical
Publication of JP3586777B2 publication Critical patent/JP3586777B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声以外の情報を入力する入力装置の使用状
況及び/又は使用履歴に基づいて、次に入力される音声
情報に施すべき処理内容及び出力態様を自動的に切り替
え可能とする。 【構成】 音声以外の、情報を入力する、例えばキーボ
ード,マウス等の入力装置2a,2b…2n夫々から使
用の有無、又は使用中か否かを示す信号を判定部7へ取
り込み、これら入力装置2a,2b…2nの使用状況及
び/又は使用履歴に基づき、音声入力部1から入力され
る音声情報の内容を判定し、判定内容い従って音声処理
部5に対して所定の処理を施すべく指示し、また出力部
6に対しては所定態様の出力を行うべく指示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は入力された音声情報に施
すべき処理内容の変更、また入力された音声情報の出力
内容の変更をスイッチ等を用いずに自動的に切換え可能
とした音声入力装置に関する。
【0002】
【従来の技術】図7は従来における音声入力装置の構成
を示すブロック図であり、図中1はマイク等の音声入力
部、2a,2b…2nはキーボード,マウス等音声以外
の他の情報を入力する入力装置を示している。音声入力
部1から入力された音声情報は音声認識部5へ入力され
る。音声認識部5は、予めスイッチ21にて入力される
音声情報、例えばテキスト情報,コマンド情報等夫々に
応じた処理モードに設定されており、処理モードがテキ
スト情報処理モードである場合には辞書格納部22から
テキスト情報処理用辞書を読み出し、これに基づいて、
またコマンド情報処理モードである場合には辞書格納部
22からコマンド情報処理用辞書を読み出し、これに基
づき入力された音声情報の認識処理を行い、認識結果を
処理結果出力部6へ出力する。処理結果出力部6も予め
スイッチ21にて入力される音声情報に対応した出力モ
ードに設定されており、入力された認識結果を、例えば
テキストとして、又はコマンドとして夫々他の入力装置
2a〜2nからの入力情報と共に出力する。
【0003】
【発明が解決しようとする課題】ところで、音声入力部
1を通じて入力されてくる対象は、例えば文章等の文字
情報である場合、又アプリケーション、ウィンドウマネ
ージャ、OSに対する操作命令である場合、又は音声波
形データである場合等その時々によって変化する。
【0004】このような種々の入力対象に対し音声認識
部5において施すべき処理の内容、処理の手順も自づと
異なるから、音声認識部5を夫々の入力対象に適応した
処理モードに切換える必要があり、従来にあっては、ス
イッチ21を手動、又は音声入力により切換えて処理モ
ードの設定を行っていた。この点は処理結果出力部6に
おいても同様である。
【0005】しかしスイッチ21を、例えば手動により
切換えるには使用者は使用中のキーボード、又はマウス
等から一旦手を離さざるを得ず、キーボード,マウスの
操作が中断されることとなり、また音声入力により切換
えるには、当然切換えのための特別なコマンドを登録し
ておく必要がある上、ノイズ,その他入力音声以外の周
辺での会話等に起因する誤認識が生じ、操作者が期待し
ていない時点で突発的に処理モード,出力モードの切換
えが行われることがある等の不都合があった。
【0006】本発明はかかる事情に鑑みなされたもので
あって、その目的とするところは入力音声に施すべき処
理の変更、及び出力態様の変更を操作者に特別の操作を
要求することなく自動的に行い得るようにすることにあ
る。本発明の他の目的は音声処理部において入力された
音声情報に対して音声認識処理を行い場合にテキスト,
コマンド等入力された音声情報に応じて音声辞書の切換
えを自動的に行い得るようにすることにある。
【0007】本発明の更に他の目的は、入力された音声
情報に対して、音声処理を施すことなく出力する場合に
も判定部にて、これを自動的に判定して出力部に対する
制御を可能とすることにある。本発明の更に他の目的
は、キーボード,マウス等通常のコンピュータに備えら
れているものの使用状況及び/又は使用履歴に基づいて
判定部が判定を行うこととすることで広範囲にわたる適
用を可能とすることにある。
【0008】本発明の更に他の目的は、入力された音声
情報が予め定めた単語である場合には判定部の判定結果
の如何にかかわらず、予め定めた態様の出力を出力部か
ら行わせることで、処理の効率化を図ることにある。本
発明の更に他の目的は、判定部における判定処理の内容
を必要に応じて変更可能とすることで、適用範囲を更に
拡大可能ならしめることにある。
【0009】
【課題を解決するための手段】以下本発明の原理を図1
に示す原理図に基づき説明する。図1は本発明に係る音
声入力装置の原理図であり、図中1は音声入力部、2
a,2b〜2nはキーボード,マウス等、音声以外の情報
を入力する入力装置を示している。音声入力部1から入
力された音声情報はディジタル情報として音声処理部5
へ入力される。
【0010】一方入力装置2a〜2nの使用状況及び/
又は使用履歴が逐次判定部7ヘ取り込まれており、判定
部7はこれら使用状況及び/又は使用履歴に基づいて、
予め設定された判定処理の内容、即ちアルゴリズムに従
って音声入力部1から現に入力されつつある音声情報又
は次に入力される音声情報が如何なる内容のものか、例
えばテキスト入力、又はコマンド入力か、又は音声処理
部において何ら処理を施す必要のないデータか等を判定
し、この判定結果に基づいて音声処理部5及び出力部6
へ夫々所定の指令を与える。
【0011】一般に、例えばキーボードの入力に熟練し
た操作者の場合、音声入力により文章等を入力するより
も、キーボードを使用して入力する方が処理を迅速に行
えるのが普通である。従ってキーボードを使用している
際、熟練した操作者においてあえて音声入力したいと考
えるような対象は、例えばウィンドウのオープン、アプ
リケーションのモード変更等の操作命令であることが多
い。一方マウスを使用中の場合には、文章等を入力する
には一旦マウスから手を離し、キーボードを使用して文
章を入力し、再びマウスに手を戻す動作が必要となるこ
とから、操作命令に限らず音声入力により文字情報の入
力を行いたいと欲する場合が多い。つまり音声以外の情
報を入力する入力装置であるキーボード,マウスの使用
履歴,使用状況を把握することで、入力音声に対して音
声処理部5で施すべき処理内容,出力部6の出力態様を
判断することが可能となるのである。
【0012】音声処理部5に対しては、入力される音声
情報に対し、音声認識処理を施すべきか否か、また音声
認識処理を施すべき場合にはテキストとして、又はコマ
ンドとして認識処理を行うべきか否かの指令を与え、音
声処理部5を制御する。また出力部6に対しては、音声
処理部5から与えられる認識結果がテキストである場合
にはテキストとして出力すべく、又はコマンドである場
合はコマンドとして出力すべく、更に音声処理部5にお
いて何ら処理を施されなかった内容については、例えば
これを波形エディタへ出力すべく指令を与え、出力部6
を制御する。
【0013】これによって音声処理部5は判定部7から
の指令に従って入力された音声情報に対応可能にモード
設定され、入力された音声情報に所定の音声処理を施し
て、又は処理を施すことなくこれを出力部6へ出力す
る。また出力部6は同じく判定部7からの指令に従って
音声処理部5からの入力が、例えばテキスト入力の場合
にはテキストとして、またコマンド入力の場合にはコマ
ンド入力として、他の入力装置2a,2b…2nからの
入力と同様、ワードプロセッサ,波形エディタ等へ出力
する。
【0014】なお、入力された音声情報の認識結果が予
め定めた特定の単語等である場合は出力部は予め定めた
態様の出力を他の態様に優先して行うこととしてもよ
い。また、操作者は判定部7の判定処理内容は任意に変
更可能であって操作者は判定結果を適用対象に応じて変
更させることで適用可能範囲を拡大し得るようにしてあ
る。
【0015】第1の発明に係る音声入力装置は、音声入
力部と、音声以外の情報を入力する入力装置と、前記音
声入力部から入力された音声情報に処理を施す音声処理
部とを備えた音声入力装置において、前記入力装置の使
用状況及び/又は使用履歴に基づいて入力された音声情
報に施すべき処理の内容を判定し、該判定結果に応じて
前記音声処理部を制御する判定部とを具備することを特
徴とする。
【0016】第2の発明に係る音声入力装置は、前記音
声処理部が複数の音声辞書と、この複数の音声辞書のう
ちのいずれか一つ又は複数を選択する辞書切替部とを備
えることを特徴とする。
【0017】第3の発明に係る音声入力装置は、音声入
力部と、音声以外の情報を入力する入力装置と、前記音
声入力部から入力された音声情報を出力する出力部とを
備えた音声入力装置において、前記入力装置の使用状況
及び/又は使用履歴に応じて入力された音声情報の内容
を判定し、この判定結果に応じて前記出力部を制御する
判定部とを具備することを特徴とする。
【0018】第4の発明の係る音声入力装置は、音声入
力部と、音声以外の情報を入力する入力装置と、前記音
声入力部から入力された音声情報に所定の処理を施す音
声処理部と、該音声処理部で処理された結果を出力する
出力部とを備えた音声入力装置において、前記入力装置
の使用状況及び/又は使用履歴に基づいて入力された音
声情報に施すべき処理内容及びこの処理結果の出力態様
を判定し、この判定結果に応じて前記音声処理部及び前
記出力部を制御する判定部とを具備することを特徴とす
る。
【0019】第5の発明に係る音声入力装置は、入力さ
れた音声情報に対する音声処理部の認識結果が予め定め
た単語である場合に、前記出力部は判定部の判定結果の
如何にかかわらず、予め定めた態様の出力を行うべく動
作するようにしてあることを特徴とする。
【0020】第6の発明に係る音声入力装置は、前記入
力装置はキーボード及び/又はマウスであることを特徴
とする。
【0021】第7の発明に係る音声入力装置は、前記判
定部の判定処理内容は、設定変更可能としてあることを
特徴とする。
【0022】
【作用】第1の発明にあっては、音声以外の情報を入力
する入力装置の使用状況,使用履歴に応じて判定部が入
力音声に施すべき処理を自動的に判定して音声処理部に
対して指示することとなり、操作者は処理内容の指示を
必要としない。
【0023】第2の発明にあっては、音声処理部におい
て音声認識のために用いる複数の辞書を辞書切替部にて
自動的に切替え可能となる。
【0024】第3の発明にあっては、波形偏集の場合の
如く入力音声に対して実質的な処理を必要としない場合
には判定部は出力部に対し、音声情報の出力態様に応じ
た指示を出力することとなり、操作者は出力部制御のた
めの特別の操作を要しない。
【0025】第4の発明にあっては、音声以外の情報を
入力する入力装置の使用状況,使用履歴に基づいて判定
部が判定結果に応じて音声処理部、出力部夫々に対し、
指令を出力することでこれらに対する制御を自動的に行
うことが可能となる。
【0026】第5の発明にあっては、判定部の判定結果
の如何にかかわらず、予め定めた認識結果に対し、出力
部に予め定めた態様の出力を行わせることで、誤動作を
低減すると共に、操作性を向上し得る。
【0027】第6の発明にあってはキーボード,マウス
の使用状況、使用履歴を用いることで、キーボード,マ
ウスを備える汎用コンピュータへの適用が可能となる。
【0028】第7の発明にあっては、判定部の判定処理
内容を必要に応じて、設定変更することで、ウインド
ウ,アプリケーション,アプリケーションのモード・状
態の各組み合わせ別に夫々に応じた判定結果を得ること
が可能となる。
【0029】
【実施例】
(実施例1)以下本発明をその実施例を示す図面に基づ
き具体的に説明する。図2は本発明に係る音声入力装置
を図形編集機能付のワードプロセッサ11に適用した場
合の構成を示すブロック図であり、図中1はマイク等に
て構成された音声入力部、2a,2bは音声以外の情報
を入力するキーボード,マウス等の入力装置を示してい
る。音声入力部1より入力された音声情報はA/D変換
部3でアナログ信号をディジタル信号に変換されて、音
声認識部として構成された音声処理部5へ入力される。
【0030】一方音声以外の情報を入力する入力装置2
a,2bからの入力情報はワードプセッサ11へ入力さ
れる他、逐次判定部7へ取り込まれる。判定部7はキー
ボード,マウス等の入力装置2a,2bからの信号に基
づき予め設定した判定処理内容,即ちアルゴリズムに従
いこれらの使用状況及び/又は使用履歴を認識し、音声
入力部1を通じて現に入力され、また後に入力されてく
る音声情報の内容及び入力される音声情報に対して施す
べき処理の内容を判定する。具体的には入力されてきた
音声情報がテキスト情報か、コマンド情報か、並びに夫
々の情報に対し音声処理部5で施すべき処理の内容及び
出力部6からの出力態様を判定し、夫々に応じた指令を
辞書切替部8及び出力部6へ与える。
【0031】なお、キーボード,マウス等の各入力装置
2a,2bにその使用の有無を検出するセンサが付設さ
れている場合、このセンサ出力を判定部7に取り込み、
これらの使用状況,使用履歴を認識し、判定を行うこと
としてもよい。辞書切替部8は判定部7からの指令によ
りテキスト用辞書、又はコマンド用辞書10を音声処理
部5へ読み出す。
【0032】音声処理部5は前記判定部7からの指令に
基づき動作される辞書切替部8にて選択的に切替えられ
たテキスト用辞書9又は/コマンド用辞書10を読み出
し、これらに基づいて、音声情報の認識処理を行い、認
識結果を出力部6へ出力する。出力部6は前記判定部7
からの指示に基づき音声情報がテキスト入力の場合には
テキストとして、またコマンド入力の場合にはコマンド
としてこれをワードプロセッサ11へ出力する。
【0033】次に本発明装置の動作を図3に示すフロー
チャートに従って説明する。図3は判定部7が現在使用
中の入力装置が何であるかに基づいて判定を行う場合の
処理過程を示すフローチャートであり、先ず使用中の入
力装置2a,2bは何れかを判断し (ステップS1)、
使用中の入力装置がマウスの場合には入力される音声情
報はワードプロセッサ11で編集中の文書に対するテキ
スト入力と判定し (ステップS2)、またキーボードで
ある場合には、入力される音声情報はワードプロセッサ
11に対するコマンド入力と判定し (ステップS3)、
夫々の判定に基づき辞書切替部8及び出力部6へ対応す
る指示を出力する。
【0034】次に具体例を挙げて処理内容を説明する。
例えば操作者がキーボードを使用してワードプロセッサ
11により文章を作成中である場合、文章のバックアッ
プを採るべく「セーブ」と発声すると、判定部7は操作
者がキーボード使用中であることを認識し、入力された
音声情報が前述の如くワードプロセッサ11に対するコ
マンド入力と判定し、辞書切替部8に対しコマンド用辞
書10を選択すべく指令を出力し、また出力部6に対し
ては音声認識部の認識結果をコマンドとして、ワードプ
ロセッサ11へ出力すべく指示する。
【0035】この結果、音声認識部として構成された音
声処理部5においては入力された音声情報を、コマンド
用辞書10を用いて「セーブ」と認識し、その認識結果
を出力部6へ出力する。出力部6は認識結果「セーブ」
をコマンド「save」としてワードプロセッサ11へ
出力し、ワードプロセッサ11はコマンド「save」
を受けて編集中の文書のセーブを行う。
【0036】また操作者がワードプロセッサ11にて図
形編集を行っているものとして、その図形中の所定部分
に、例えば「日本語」というテキストを書入れるべく、
先ず「日本語」を入れたい位置をマウスにて指定し、
「日本語」と発声したとする。判定部7は操作者がマウ
スの使用中であることを認識し、前述した如く入力され
た音声をワードプロセッサ11の編集中の文書に対する
テキスト入力と判定し、辞書切替部8にテキスト用辞書
9を選択すべく指示し、また出力部6に対してはテキス
ト表示として出力すべく指示する。
【0037】これによって音声処理部5は入力された音
声情報をテキスト用辞書9を用いて「日本語」と認識
し、この認識結果を出力部6へ出力する。出力部6は
「日本語」をテキストとしてワードプロセッサ11へ出
力し、ワードプロセッサ11はマウスによる指示位置に
テキストである「日本語」を挿入表示する。
【0038】(実施例2)実施例2は波形エディタ12
を用いて入力された音声情報に対する編集を行ってお
り、入力された音声情報に対し音声認識部として構成さ
れた音声処理部5が特別な処理を施す必要のない場合を
示している。図4は本発明の実施例2の構成を示すブロ
ック図である。この実施例2においてはA/D変換部3
と音声認識部として構成された音声処理部5との中間に
音声記憶部4を介装し、判定部7からの指示は辞書切替
部8,出力部6の他に、この音声記憶部4へも出力する
ようにしてある。また波形エディタ12はキーボード,
マウス等の入力装置2a,2b夫々からの出力の他に、
出力部6からの出力が入力され、波形エディタ12から
は波形エディタ使用中であることを示す信号が判定部7
へ与えられるようにしてある。
【0039】判定部7は、キーボード,マウス等の入力
装置2a,2bの使用を示す信号と、波形エディタ12
からの波形エディタの使用を示す信号とに基づき、入力
された音声情報の内容が波形編集のためのデータである
ことを認識し、音声記憶部4へ音声を記憶すべく指令を
出力し、また出力部6に対してはその波形を波形エディ
タ12へ出力すべく指令を出力する。図5は判定部7の
処理過程を示すフローチャートである。先ず、入力され
た音声情報が音声記憶部4に録音中か否かを判定し(ス
テップS11)、録音中であれば入力された音声情報
(波形)を出力するのみで、これに対する認識処理を行
わない対象であると判定する(ステップS12)、一方
入力された音声情報を録音していない場合には、使用中
の入力装置はキーボードか、又はマウスかを判断する
(ステップS13)。
【0040】キーボードの場合には入力された音声情報
をコマンド入力と判定し(ステップS14)、またマウ
スを使用中の場合には文字入力の要求が有るか否かを判
断し(ステップS15)、無い場合には入力された音声
情報をコマンド入力と判定し(ステップS14)、また
有る場合には入力された音声情報はテキスト入力と判定
する(ステップS16)。
【0041】具体的に操作者が自らの声をマイクを通じ
て入力(録音)し、その波形を編集し、編集結果をファ
イルに保存すべく作業中の場合について説明する。操作
者はマイクに向かって発声し、自らの声の録音を開始す
る。このような状態下では波形エディタ12から判定部
7に対し、音声の録音中である旨の情報が入力される。
これによって判定部7は音声処理部5で入力された音声
情報に対し、音声の認識処理を施す必要がなく、単にそ
の波形を出力するのみでよいと判定する。判定部7はこ
の判定に基づき音声記憶部4に対し入力された音声情報
を録音すべく指令し、また出力部6に対しては入力され
た音声波形をそのまま波形エディタ12へ出力すべく指
示する。なお辞書切替部8に対しては音声認識処理を必
要としないことから指令は出力されない。
【0042】この結果、A/D変換部3にてディジタル
化された音声情報は音声記憶部4にて録音された後、直
接出力部6へ出力され、また出力部6は入力された音声
波形を波形エディタ12へ出力する。操作者は発声の録
音が終了すると波形の編集を開始する。波形エディタ1
2は操作者が波形の区間をマウスを用いて指定し、「エ
コー」と発声すると指定された波形に対しエコー処理を
施し、また「クリア」と発声したとすると指定された波
形を消去すべく処理を行う。
【0043】即ち、現在キーボードの使用中である場
合、判定部7はキーボードからの使用中であることを示
す信号及び波形エディタ12を通じて入力される信号に
基づき入力された音声情報はコマンドであると判定す
る。これに従って判定部7は音声記憶部4に対し、音声
処理部5へ音声を送るべく指令し、また辞書切替部8に
対してはコマンド用辞書10を選択すべく指令し、出力
部6に対してはコマンドを波形エディタ12へ送るべく
指令する。
【0044】この結果、音声処理部5はコマンド用辞書
10を用いて入力された音声情報に対する認識処理を行
い、入力音声である、例えば「エコー」又は「クリア」
を認識し、これを出力部6へ出力する。出力部6は認識
結果である「エコー」又は「クリア」をコマンドとして
波形エディタ12へ送り、このコマンドが実行される。
次に操作者が編集した内容を保存すべく「セーブ」と発
声したとする。この「セーブ」が名称未設定ファイル、
換言すれば新規ファイルである場合、波形エディタ12
はファイルの名称を要求する。そこでファイル名として
「自分の声」と発声した場合、マウスを使用中であって
も波形エディタ12はテキスト入力を要求するから判定
部7が入力された音声情報をテキストと判定する。
【0045】判定部7は辞書切替部8に対しテキスト用
辞書9を選択すべく指令を出力し、また出力部6に対し
てはテキストとしての「自分の声」を出力すべく指示す
る。この結果、音声処理部5はテキスト用辞書9を用い
て音声情報に対する認識処理を行い、これを出力部6へ
出力する。出力部6は認識結果である「自分の声」をテ
キストとして波形エディタ12へ出力し、ファイル名で
ある「自分の声」が波形エディタ12へ入力され、セー
ブされる。このような実施例2にあってはファイル名の
如き文字入力、又は「エコー」の如きディレイタイムの
数値入力等は操作中のマウスからキーボードに手を移さ
なくても音声入力により入力が可能となる。
【0046】なお、実施例1,2のいずれの場合につい
て、判定部7の判定結果が如何なるものであっても、音
声認識の結果が予め定めた「特定単語」である場合には
出力部6は予め定めた所定の出力制御を行うこととして
もよい。例えば特定単語がウィンドウマネージャー,O
Sに対する操作指令である「リサイズ」又は所定の人
名、例えば「田中」である場合、出力部6は「リサイ
ズ」の場合にあってはウィンドウのサイズ変更のための
操作指令をウィンドウマネージャー,OSへ出力する。
【0047】「リサイズ」の場合、所定のウィンドウの
もとでアプリケーションを操作中であって、判定部7が
入力された音声情報をアプリケーションへのコマンドと
判定した場合、実質的に入力音声に対する処理内容の優
先順位を認識結果を利用して設定しているのと等価とな
り、操作性が格段に向上する。また、広く使われている
人名である、例えば「田中」が音声入力部1から入力さ
れた場合、これを「無視」するように判定部の処理内容
を設定することで周囲から「田中」の音声が頻繁に混入
する虞れがある場合においてもこれによる誤認を避け得
ることとなる。
【0048】(実施例3)実施例1,2では判定部7に
対して入力装置2a,2bの使用状況,使用履歴に基づ
き如何なる判定を行わせるかの判定処理内容は、音声入
力システムの始動に際して初期設定される場合について
説明したが、この実施例3では任意の時点で再設定する
ことが可能となっている。
【0049】図6(a)は判定部7における判定処理内
容、即ちアルゴリズムの初期設定処理過程、図6(b)
はアルゴリズムの設定変更処理過程夫々のフローチャー
トである。先ず、アルゴリズムの初期設定は音声入力装
置の起動時に初期設定ファイルが存在するか否かを判断
し (ステップS21)、存在しない場合は「固有の設
定」、例えばキーボード使用時はコマンド入力と、また
マウス使用時はテキスト入力とする判定処理の設定を行
う (ステップS22)。
【0050】また存在する場合、換言すればユーザーが
好みに応じて設定する設定ファイルが存在する場合には
前期「固有の設定」に優先して、判定部7は初期設定フ
ァイルを読込み (ステップS23)、この初期設定ファ
イルの内容に従って設定を行い (ステップS24)、設
定ファイルに現在の設定内容を保存する (ステップS2
5)。
【0051】一方再設定を行う場合には設定ファイルを
ユーザーがエディタ等を用いて変更し(ステップS3
1)、新たな設定ファイルを読込み(ステップS3
2)、この読み込んだ設定ファイル内容に応じて再設定
を行う(ステップS33)。
【0052】次に具体例を挙げて説明する。いま、例え
ば初期設定ファイルの内容が表1の如きものであったと
する。
【0053】
【表1】
【0054】このような初期設定ファイルを読込んだ判
定部7はデフォルトの場合、キーボード使用時にあって
は、入力された音声情報をコマンド入力と判定し、また
マウス使用時あっては入力された音声情報を無視するこ
ととなる。
【0055】また操作者が文章エディタを使用している
場合、文章エディタのウィンドウがアクティブであれ
ば、キーボード使用時には入力された音声情報をコマン
ド入力と、またマウス使用時には入力された音声情報を
テキスト入力と判定する。一方このような初期設定ファ
イルのもとで音声入力装置を使用中に、操作者が波形エ
ディタを使用しようとした場合、この初期設定ファイル
で音声波形データの設定が出来ないから設定ファイルの
再設定を行う。いま、再設定のファイルが表2の如くで
あったとする。
【0056】
【表2】
【0057】これによって、いま波形エディタを使用し
ている状況下では、キーボード使用中の場合には、判定
部7は入力された音声情報をコマンド入力と、またマウ
スを使用中の場合には入力された音声情報を波形入力と
夫々判定する。ただ波形エディタを使用している状況下
であっても、ファイル名入力時にはキーボード、マウス
のいずれを使用中であっても判定部7は入力された音声
情報をテキスト入力と判定することとなる。
【0058】このような実施例3にあっては判定部7に
対し、キーボードの使用中にあっては入力された音声情
報を「コマンド」として、またマウス使用中にあっては
入力された音声情報を「テキスト」と判定すべく判定の
アルゴリズムを設定しておくことで判定部7がこれに従
って自動的に判定処理する。これによって操作者の動作
と、入力された音声に対する取扱いが協調的となり、作
業効率が向上する。
【0059】
【発明の効果】第1の発明にあっては判定部が音声以外
の情報を入力する入力装置の使用状況、使用履歴に基づ
いて音声処理部に対してどのような処理を行わせるかを
判定することで、この判定結果に基づき音声処理部の処
理が自動的に切替えられることとなり、操作者は特別な
操作を行うことなく、発声のみで自動処理することが可
能となる。
【0060】第2の発明にあっては音声処理部において
音声認識を行う場合には、各種の辞書を操作者が特別な
指示を行うことなく、自動的に選定して音声処理部への
読出しを可能とする。
【0061】第3の発明にあっては出力部が判定部の判
定結果に基づいて入力音声情報に対する出力制御、例え
ばテキストとしての出力、コマンドとしての出力等を操
作者が特別な操作を行うことなく自動的に行い得る。
【0062】第4の発明にあっては判定部が入力装置の
使用状況,使用履歴に基づいて入力される音声情報に対
する処理内容を判断し、音声処理部,出力部を夫々に応
じて制御するから操作者は特別な操作を要求されること
なくこれらの自動処理が可能となる。
【0063】第5の発明にあっては、判定部の判定結果
の如何にかかわらず予め定めた特定の音声が入力された
場合には、予め定めた最優先順位の処理を行わせること
で誤認識が低減される共に、操作性が向上する。
【0064】第6の発明にあっては、判定部の判定処理
の内容を任意に設定変更可能とすることで現に動作中の
ウィンドウ,アプリケーション,アプリケーションのモ
ード・状態等、夫々に応じた判定結果を得ることが出
来、より細かな状況に応じた判定結果が得られること
で、操作性が向上する。
【0065】第7の発明にあっては、キーボード,マウ
スを備える汎用コンピュータに広く適用可能となる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の実施例1の構成を示すブロック図であ
る。
【図3】実施例1における判定部の処理過程を示すフロ
ーチャートである。
【図4】実施例2の構成を示すブロック図である。
【図5】実施例2における判定部の処理過程を示すフロ
ーチャートである。
【図6】実施例3における判定部の判定処理内容の初期
設定過程及び設定変更過程を示すフローチャートであ
る。
【図7】従来装置の構成を示すブロック図である。
【符号の説明】
1 音声入力部 2a〜2n 入力装置 5 音声処理部 6 出力部 7 判定部 8 辞書切替部 9 テキスト用辞書 10 コマンド用辞書 11 ワードプロセッサ 12 波形エディタ

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声入力部と、音声以外の情報を入力す
    る入力装置と、前記音声入力部から入力された音声情報
    に所定の処理を施す音声処理部とを備えた音声入力装置
    において、前記入力装置の使用状況及び/又は使用履歴
    に基づいて入力された音声情報に施すべき処理の内容を
    判定し、該判定結果に応じて前記音声処理部を制御する
    判定部とを具備することを特徴とする音声入力装置。
  2. 【請求項2】 前記音声処理部は複数の音声辞書と、こ
    の複数の音声辞書のうちのいずれか一つ又は複数を選択
    する辞書切替部とを備えることを特徴とする請求項1記
    載の音声入力装置。
  3. 【請求項3】 音声入力部と、音声以外の情報を入力す
    る入力装置と、前記音声入力部から入力された音声情報
    を出力する出力部とを備えた音声入力装置において、前
    記入力装置の使用状況及び/又は使用履歴に応じて入力
    された音声情報の内容を判定し、この判定結果に応じて
    前記出力部を制御する判定部とを具備することを特徴と
    する音声入力装置。
  4. 【請求項4】 音声入力部と、音声以外の情報を入力す
    る入力装置と、前記音声入力部から入力された音声情報
    に所定の処理を施す音声処理部と、該音声処理部で処理
    された結果を出力する出力部とを備えた音声入力装置に
    おいて、前記入力装置の使用状況及び/又は使用履歴に
    基づいて入力された音声情報に施すべき処理内容及びこ
    の処理結果の出力態様を判定し、この判定結果に応じて
    前記音声処理部及び前記出力部を制御する判定部とを具
    備することを特徴とする音声入力装置。
  5. 【請求項5】 入力された音声情報に対する音声処理部
    の認識結果が予め定めた単語である場合に、前記出力部
    は判定部の判定結果の如何にかかわらず、予め定めた態
    様の出力を行うべく動作するようにしてあることを特徴
    とする請求項4に記載の音声入力装置。
  6. 【請求項6】 前記入力装置はキーボード及び/又はマ
    ウスであることを特徴とする請求項1〜5のいずれかに
    記載の音声入力装置。
  7. 【請求項7】 前記判定部の判定処理内容は、設定変更
    可能としてあることを特徴とする請求項1〜5のいずい
    れかに記載の音声入力装置。
JP19341894A 1994-08-17 1994-08-17 音声入力装置 Expired - Fee Related JP3586777B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19341894A JP3586777B2 (ja) 1994-08-17 1994-08-17 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19341894A JP3586777B2 (ja) 1994-08-17 1994-08-17 音声入力装置

Publications (2)

Publication Number Publication Date
JPH0863330A true JPH0863330A (ja) 1996-03-08
JP3586777B2 JP3586777B2 (ja) 2004-11-10

Family

ID=16307642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19341894A Expired - Fee Related JP3586777B2 (ja) 1994-08-17 1994-08-17 音声入力装置

Country Status (1)

Country Link
JP (1) JP3586777B2 (ja)

Cited By (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (ja) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk 真空切替遮断器
JP2001042892A (ja) * 1999-07-08 2001-02-16 Microsoft Corp 音声入力用グラフィカル・ユーザ・インターフェース、その処理方法および記録媒体
JP2001184086A (ja) * 1999-10-19 2001-07-06 Microsoft Corp スピーチ認識モード・エラーを補正するシステム及びその方法
JP4855421B2 (ja) * 2005-12-14 2012-01-18 三菱電機株式会社 音声認識装置
JP2013073240A (ja) * 2011-09-28 2013-04-22 Apple Inc コンテキスト情報を使用した音声認識修正
US8892446B2 (en) 2010-01-18 2014-11-18 Apple Inc. Service orchestration for intelligent automated assistant
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9300784B2 (en) 2013-06-13 2016-03-29 Apple Inc. System and method for emergency calls initiated by voice command
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
WO2016148157A1 (ja) * 2015-03-17 2016-09-22 株式会社メガチップス 音声認識システムおよび音声認識方法
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9697822B1 (en) 2013-03-15 2017-07-04 Apple Inc. System and method for updating an adaptive speech recognition model
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
WO2022003879A1 (ja) * 2020-07-01 2022-01-06 日本電信電話株式会社 音声操作装置、音声操作方法および音声操作プログラム
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3979209B2 (ja) 2002-07-23 2007-09-19 オムロン株式会社 データ入力方法およびデータ入力装置

Cited By (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (ja) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk 真空切替遮断器
JP2001042892A (ja) * 1999-07-08 2001-02-16 Microsoft Corp 音声入力用グラフィカル・ユーザ・インターフェース、その処理方法および記録媒体
JP2001184086A (ja) * 1999-10-19 2001-07-06 Microsoft Corp スピーチ認識モード・エラーを補正するシステム及びその方法
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP4855421B2 (ja) * 2005-12-14 2012-01-18 三菱電機株式会社 音声認識装置
US8942986B2 (en) 2006-09-08 2015-01-27 Apple Inc. Determining user intent based on ontologies of domains
US8930191B2 (en) 2006-09-08 2015-01-06 Apple Inc. Paraphrasing of user requests and results by automated digital assistant
US9117447B2 (en) 2006-09-08 2015-08-25 Apple Inc. Using event alert text as input to an automated assistant
US10568032B2 (en) 2007-04-03 2020-02-18 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US9535906B2 (en) 2008-07-31 2017-01-03 Apple Inc. Mobile device having human language translation capability with positional feedback
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10475446B2 (en) 2009-06-05 2019-11-12 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US8892446B2 (en) 2010-01-18 2014-11-18 Apple Inc. Service orchestration for intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8903716B2 (en) 2010-01-18 2014-12-02 Apple Inc. Personalized vocabulary for digital assistant
US9424861B2 (en) 2010-01-25 2016-08-23 Newvaluexchange Ltd Apparatuses, methods and systems for a digital conversation management platform
US11410053B2 (en) 2010-01-25 2022-08-09 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10984327B2 (en) 2010-01-25 2021-04-20 New Valuexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US10984326B2 (en) 2010-01-25 2021-04-20 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US10607140B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US9424862B2 (en) 2010-01-25 2016-08-23 Newvaluexchange Ltd Apparatuses, methods and systems for a digital conversation management platform
US10607141B2 (en) 2010-01-25 2020-03-31 Newvaluexchange Ltd. Apparatuses, methods and systems for a digital conversation management platform
US9431028B2 (en) 2010-01-25 2016-08-30 Newvaluexchange Ltd Apparatuses, methods and systems for a digital conversation management platform
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9798393B2 (en) 2011-08-29 2017-10-24 Apple Inc. Text correction processing
JP2015018265A (ja) * 2011-09-28 2015-01-29 アップル インコーポレイテッド コンテキスト情報を使用した音声認識修正
JP2013073240A (ja) * 2011-09-28 2013-04-22 Apple Inc コンテキスト情報を使用した音声認識修正
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
US9697822B1 (en) 2013-03-15 2017-07-04 Apple Inc. System and method for updating an adaptive speech recognition model
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9633674B2 (en) 2013-06-07 2017-04-25 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9300784B2 (en) 2013-06-13 2016-03-29 Apple Inc. System and method for emergency calls initiated by voice command
US10791216B2 (en) 2013-08-06 2020-09-29 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US11556230B2 (en) 2014-12-02 2023-01-17 Apple Inc. Data detection
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
WO2016148157A1 (ja) * 2015-03-17 2016-09-22 株式会社メガチップス 音声認識システムおよび音声認識方法
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
WO2022003879A1 (ja) * 2020-07-01 2022-01-06 日本電信電話株式会社 音声操作装置、音声操作方法および音声操作プログラム

Also Published As

Publication number Publication date
JP3586777B2 (ja) 2004-11-10

Similar Documents

Publication Publication Date Title
JPH0863330A (ja) 音声入力装置
JP3926220B2 (ja) タッチスクリーン又は音声認識を通じて動作制御される情報端末及びその命令実行方法
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
US6519566B1 (en) Method for hands-free operation of a pointer
US7260529B1 (en) Command insertion system and method for voice recognition applications
US20050114132A1 (en) Voice interactive method and system
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP2004054080A (ja) データ入力方法およびデータ入力装置
JP4667085B2 (ja) 音声対話システム、コンピュータプログラム、対話制御装置及び音声対話方法
US5870705A (en) Method of setting input levels in a voice recognition system
JPH08166866A (ja) 対話型インターフェースを具備した編集支援システム
JP2001268669A (ja) 移動電話端末を利用した機器制御装置、方法、及び記録媒体
JP6993382B2 (ja) ロボット教示装置
JP2009288815A (ja) 機器制御装置、音声認識装置、エージェント装置、機器制御方法及びプログラム
JP2002108390A (ja) 音声認識装置及びコンピュータ読み取り可能な記録媒体
JP3744161B2 (ja) 音声指示装置および音声指示情報記憶媒体
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP2003255987A (ja) 音声認識を利用した機器の制御方法、制御装置及び制御プログラム
JP4528384B2 (ja) 音声入力用グラフィカル・ユーザ・インターフェースのための表示装置
JPH07219591A (ja) 音声処理装置および方法
JP2005024869A (ja) 音声応答装置
JP2002268683A (ja) 情報処理方法及び装置
JPH05158618A (ja) カーソル制御装置
JP3299418B2 (ja) 音声認識の方法及び装置
JP2002007015A (ja) 情報処理装置およびコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040727

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040727

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090820

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100820

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110820

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120820

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees