JP2002091492A - 音声補完方法、装置および記録媒体 - Google Patents
音声補完方法、装置および記録媒体Info
- Publication number
- JP2002091492A JP2002091492A JP2000380781A JP2000380781A JP2002091492A JP 2002091492 A JP2002091492 A JP 2002091492A JP 2000380781 A JP2000380781 A JP 2000380781A JP 2000380781 A JP2000380781 A JP 2000380781A JP 2002091492 A JP2002091492 A JP 2002091492A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- user
- complement
- recording medium
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
Abstract
は、入力したい内容を正確にすべて発声しなければ入力
できず、うろ覚えの単語や文章は入力できなかった。ま
た、入力したい内容が長くて複雑なときに、人間同士な
らば、その内容を特定するのに十分な部分まで発声すれ
ば伝わるのに、音声認識システムに対しては最後まです
べて発声する必要があった。 【解決手段】 有声休止をトリガーとして採用すること
により音声補完を可能とした。
Description
て一般的に適用される音声補完方法、装置および記録媒
体に関するものである。
にとって快適で優れた情報交換手段である一つの理由
は、対話相手が様々な形で自分の発話や思考の手助けを
してくれるからである。すなわち、人間同士の音声対話
においては、たとえ話者がある単語を最後まで思い出せ
ず、その途中に言い淀むことがあったとしても、対話相
手は、話者の言いたいことを推測して候補を提示するこ
とで、話者が思い出すのを手助けしてくれるのである。
例えば、話者が「音声補完」という単語全体を思い出せ
ず「おんせいー」と言い淀むと、対話相手が「音声補完
?」と問いかけて手助けをしてくれる。これは、発話さ
れた単語の断片の続きを補うことで、話者が述べようと
している単語全体の候補を提示している、つまり、単語
を補完していると見なすことができる。
おいては既に広く受け入れられている。例えば、tcshや
bash等のUNIX(登録商標)シェル及びEmacs/Mule等
のテキストエディタは、ファイル名やコマンド名の補完
機能を提供している。こうした補完機能においては、ユ
ーザが補完機能を呼び出すキー(以下「補完トリガーキ
ー」という。)を押したときに、途中までタイプされた
単語の断片の続きが補われる。他にも、Netscape Commu
nicator及びInternet Explorer等のWWWブラウザにおい
ては、URL等の自動補完機能が導入されている。これ
は、ユーザがタイプしている最中に、システム側が補完
候補一覧を次々と提示していく機能である。
フェース以外でも導入され始めている。例えばペン入力
においては、予測ペン入力インタフェースやPOBox等の
自動補完機能を持ったインタフェースが提案されている
(予測ペン入力に関しては、福島俊一、山田洋志「予測
入力インタフェースとその手書き操作削減効果」情処学
論、Vol.37,No.1,pp.23-30(1996)、POBoxについては、M
asui,T.「An Efficient Text Input Method for Pen-ba
sed Computers」Proceedings of the ACM Conference o
n Human Factors in Computing Systems(CHI'98),pp.32
8-335(1998)参照)。
タフェースにおいては、音声入力中に補完機能を呼び出
す適当な手段がなかったために、音声補完入力が存在し
ないというのが実状であった。
ても補完を行うことができる音声補完方法、装置および
記録媒体を提供することにある。
対する音声入力中に、ユーザが入力したいすべてを発話
せずにその断片だけを発話しても、システムが残りを補
って入力することを可能にする音声入力インタフェース
機能(以下「音声補完」という。)を導入することによ
り、音声認識を中心とした音声インタフェースをより使
いやすくすることを可能とした。
に、補完トリガーキーによる補完と、発声中に次々と補
完候補を出すような自動補完の二つが考えられる。しか
し、音声で自動補完をしようとしても、発話した断片を
認識する時点で既に曖昧性が大きいため、テキスト補完
と同じような精度で適切な候補を提示し続けることはで
きず、自動補完機能自体が煩わしくなってしまう可能性
が高い。つまり、音声の自動補完は不適切な機能となり
やすい。そこで、音声補完の場合には、ユーザが候補を
見たいと思うタイミングで、自発的に補完機能を呼び出
せることが重要となる。使いやすい音声補完を実現する
ためには、どのように補完機能を呼び出すか、つまり音
声における補完トリガーキーを何にするかが鍵となる。
である有声休止(filled pause)に補完トリガーキーの役
割を担わせることで、ユーザが自分の意志で、労力をか
けずに補完機能を呼び出すことを可能にする。ここで有
声休止とは、つなぎ語と音節の引き延ばし (日本語では
母音の引き延ばし)の二つに分類され、つなぎ語とは、
「えー」、「うー(ん)」、「あー」、「まー」、「ん
ー」、「あのー」、「そのー」、「このー」のようなも
のである。補完トリガーキーとして、音声入力中に有声
休止を行うことは、人間にとって極めて自然な行為であ
る。
た役割で用いられることがあり、話者は、次の単語を思
い出すまでの間、時間を稼ぐために有声休止を用いた
り、場合によっては対話相手の助けを期待しながら有声
休止を用いたりしているのである。
について説明する。
ォワード補完)]第1の方法は、言い淀み現象の一つで
ある有声休止に、補完機能を呼び出す補完トリガーの役
割を担わせることで、ユーザが自分の意志ではあるが、
あまり労力をかけずに音声補完を行うことを可能にす
る。
の辞書に登録されている場合には、「おんせいー」と
「い」の引き延ばしにより有声休止を行うか、あるい
は、「おんせい、えー」とつなぎ語「えー」により有声
休止を行うと、「音声補完」のように補完されて表示さ
れる。補完候補が複数ある場合には、システムがその候
補を画面に表示あるいは音声合成をしたりして提示し、
ユーザがその中から適切な候補を選べばよい。補完候補
が一つのときには、ユーザに確認を求めてもよいし、自
動的に最後まで入力してもよい。
クワード補完)]第2の方法は、ユーザが発声途中で意
図的に有声休止を行いながらある特定のキーワード
(「なんとかー」等)を発声すると、そのキーワード全体
をワイルドカード(任意の文字列)とみなし、システムが
その前後からワイルドカード部分を補って入力すること
を可能にする。
の辞書に登録されているときに、「なんとかー」という
有声休止を伴うキーワードを使って、「なんとかーほか
ん」と発声すれば、「なんとかー」の部分を任意の文字
列に置き換えた候補一覧(「音声補完」「音声ワイルド
カード補完」等)を見て選択できる。補完候補が複数あ
る場合には、システムが画面に表示したり音声合成をし
たりして提示し、ユーザがその中から適切な候補を選
ぶ。補完候補が一つの場合には、ユーザに確認を求めて
もよいし、自動的に最後まで入力してもよい。
レベルを対象として実施が可能であるが、以下、単語を
例にとって、有声休止を用いた音声補完について説明す
る。ただし、ここでの単語は、音声認識システムの単語
辞書上(言語モデル上)の1単語とする。したがって、例
えば「宇多田ヒカル」のような姓名が一つの単語として
登録されているときに、「うただー」と「だ」の音で有
声休止を行うと、「宇多田ヒカル」が補完候補の一つと
して得られる。
音声補完しながら、単語を入力することができる(図1
参照)。
と、既に発声された断片から始まる補完候補(単語)の一
覧が、番号付きで即座に表示される。例えば、「うただ
ー」と入力すると(図2)(図3)、 「1. 宇多田ヒカル、 2. 上原多香子、 3. MR.DYNAMIT
E」 のように補完候補が表示される(図4)。あるいは、ワ
イルドカードキーワードの最後の母音を引き延ばし
(例、「なんとかー」)、続いて単語の後半を発声する
と、その発声された断片が末尾に付く補完候補の一覧
が、同様に番号付きで表示される。
場合には、「次の候補」というマークが表示される。こ
の場合、「次」「次の」「次の候補」のいずれかを発声
すると他の候補を見ることができる。補完候補が不適切
なとき、あるいは別の単語を入力したくなったときは、
次の3.の選択をせずに別の発話に移ってもよい。
通りの方法で補完候補を選択できる。 (a) 候補の番号を言って選択する(図5)。(例えば、
「1番」か「1」と発声する。) (b) 単語の続き、あるいは単語の前半を読み上げて選択
する。(例えば、「ひかる」と発声する。) (c) 単語全体を頭から読み上げて選択する。(例えば、
「うただひかる」と発声する。) (d) 候補を他のデバイス(キーボードやマウス、タッチ
パネル等)で選択する。 選択すると、その候補は強調表示され(図6)、音声認
識結果として確定される(図7)。
返し呼び出すことが可能である。例えば、「サザンオー
ルスターズ」を入力するときに、「さざんー」で候補一
覧を見た後、「おーるー」でさらに絞り込まれた候補一
覧を見て、最後に「すたーず」と言って確定できる。な
お、この例に示したように、単語中の長母音(「おー
る」の /o-/ )においては音声補完が呼び出されず、意
図的に有声休止した箇所でのみ呼び出されるようにする
必要がある。
フェースシステムを実装し、運用した結果、音声補完が
実用的に機能し、ユーザが音声補完を呼び出しながら、
インタラクティブに音声入力できることを確認した。音
声補完は、使用するのが容易で訓練は不要であり、直感
的で使いやすいインタフェース機能であることがわかっ
た。特に、長い語句を入力する際に、音声補完は非常に
有効であった。
入力、住所入力といった各種固有名詞の入力で有用性を
確認したが、システムに対して音声で入力するような様
々な局面にもすぐに適用できるものである。
装置の好適実施形態を図8を参照して説明する。
0、システムメモリ20、入出力インターフェース(I
/O)30、入力装置40、ディスプレイ50およびハ
ードディスク(HD)60を有する。音声補完装置とし
てパーソナルコンピュータなど、プログラムを実行可能
な情報処理機器を使用することができる。
された後述のプログラムを実行して、音声補完機能を実
現する。システムメモリ20はRAMを有し、RAM上
に実行すべきプログラムをロードすると共に、CPU1
0に対する入出力データを一時記憶する。
し、マイクロホンから入力された音声をCPU10に転
送する。入力装置40はキーボードとマウスまたはタッ
チパネル等を有し、CPU10に対する動作指示を行
う。ディスプレイ50は入力装置40からの入力情報
や、CPU10により実行された音声認識処理の認識結
果を表示する。また、CPU10により補完された文字
列をも表示する。さらに、補完可能な文字列が複数ある
場合には複数組の文字列を表示して、ユーザの選択をI
/O30あるいは入力装置40を介して受け付ける。
ム、単語辞書および、これらプログラムで使用する表示
用データや各種データをストアしている。音声認識プロ
グラムは市販品と同等のものを使用することができる
が、以下に述べる補完機能を付加するように音声認識プ
ログラムを改良する必要がある。
止区間を検出すると、補完候補一覧を作成する。補間候
補一覧を作成する処理は、既存の連続音声認識プログラ
ムを以下に述べるように拡張して実現する。
認識には副作用のないようにする必要がある。以下、単
語発声の補完を説明するが、連続音声中の単語を補完す
ることも同じ枠組で可能である。本システムは単語辞書
として、入力対象の単語辞書(人名等)以外に、ワイルド
カードキーワード辞書とインタフェース操作用語辞書
(候補番号や他候補の表示指示等)を使用する。単語辞書
は、図10のように木構造で保持される。
辞書の根から、フレーム同期で枝別れに応じて仮説を増
やして、ノードを葉の方向へたどっていく。図中のくさ
び形のマークが仮説をあらわす。有声休止が検出される
と、その時点で最も尤度の高い仮説がワイルドカードキ
ーワードかどうかを判定し、音声フォワード補完と音声
バックワード補完のどちらを実行するかを決定する。音
声フォワード補完の場合、その時点で有効な仮説(尤度
の高い順に上位Nseed個)から葉の方向へたどることで、
補完候補の生成を実現する。それらを尤度の高い順に番
号付けして、上位N choice 個を取得する。
を補完候補のシードと呼ぶ。例えば、図10の一番上の
黒い丸がシードであるとすると、補完候補は“Blankey
jetcity ”と“Black flys ”になる。同時に、そこま
でに認識した音素列を求めることにより、各候補におい
てどこまで発声されたかを調べる。
を言っても選択できるように、認識を開始する根を登録
するエントリノードテーブルを導入し、単語の途中から
の認識を可能にする。通常の単語の頭からの認識では、
このテーブルには単語辞書の根だけが登録されている。
単語の途中から認識を開始したい場合には、図10のよ
うに補完候補のシードを根として一時的に(有声休止を
伴う発話の次の発話だけ)追加する。追加エントリは、
有声休止後の続きの音素列だけを言えば認識されるが、
認識結果としては、その単語全体とする。
休止終了時点以降に発声された単語の後半部分を認識
し、補完候補を生成する必要がある。この単語の途中か
らの認識は、辞書中の全単語の途中の音節を、エントリ
ーノードテーブルに一時的に(ワイルドカードキーワー
ドの直後だけ)追加することで実現する。そして葉に到
達した仮説から尤度の高い順に番号付けして、上位Ncho
ice 個を送信する。その後、単語の頭を言っても選択で
きるようにするために、各候補で発声されなかった音素
列の部分の終端を葉とする単語を一時的に登録する。例
えば、「小柳ゆき」を「なんとかーゆき」で入力した場
合、/koyanagi/の末尾を一時的に葉とする単語を追加す
る。
する。図9は改良された音声認識プログラムの内容を示
す。音声認識プログラムは入力装置40からの指示で、
システムメモリハードディスク60からシステムメモリ
20にロードされた後CPU10により実行される。C
PU10はI/O30を介して不図示のマイクロホンか
ら音声を入力すると、従来と同様、デジタル信号の形態
の音声をシステムメモリ20に一時記憶する(ステップ
S10)。このとき、CPU10は入力される音声デー
タを調べて、信号処理により有声休止(母音の引き延ば
し、持続した有声音、filled pause)の区
間をたとえば、特願平11ー305768号に示される
方法で検出する。
ステムメモリ20に記憶した音声データについて音声認
識プログラムを使用して音声認識およびその補完を行う
(ステップS30)。音声認識結果は従来と同様、単語
辞書や文法に基きながら音素列の仮説を複数生成し、各
尤度を評価し、尤度の最も高いものから得られる。
て、絶えず、有声休止があるかどうかの判断を行ってお
り、有声休止があることが検出されると、音素列の仮説
に基いて単語辞書を参照しながら上述の補完処理を実行
する(ステップS20)。
手順はステップS30→S70へと進み、これまでの音
声認識結果が出力される。
表示される。ユーザは表示された複数の補完語候補の中
の所望の候補をたとえば、音声やマウス、タッチパネル
により選択する(ステップS60)。補完候補が1つの
場合に場合には、確認のためにユーザの選択を待っても
よいし、自動選択(確定)してもよい。選択された候補
が最終的な補完結果として決定される。補完結果も音声
認識結果として出力される(ステップS70)。
である。 1)補完された音声認識結果を出力する出力手段は、デ
ィスプレイの外に、プリンタ、合成音声出力用スピー
カ、他のコンピュータへの通信装置、フロッピー(登録
商標)ディスクなどの記録媒体への情報を書き込むドラ
イブとすることができる。なお、上記スピーカから合成
音声を出力する場合には、周知の音声合成用プログラム
を使用して音声認識結果の文字列に基いて音声を合成す
ればよい。さらに、補完候補を合成音声でユーザに報知
してもよいし、この場合、ユーザの選択は音声入力でお
こなってもよいし、入力装置40を使用してもよい。音
声入力を使用する場合には、CPU10により入力音声
を音声認識して、音声認識結果に基き、ユーザが選択し
た補完文字列を識別する。 2)音声補完装置は、ICチップ、携帯電話機、パーソ
ナルコンピュータ、その他情報処理機器の形態で実現す
ればよい。
助を行うことができる。たとえ、入力したい内容がうろ
覚えであっても、部分的に思い出して発声することがで
きれば、システムの手助けにより入力することが可能に
なる。
長くて複雑なときにおいても、その内容を特定するのに
十分な部分だけを発声することにより、システムが残り
を補完して入力することができるという効果がある。
フェースの多くが、ユーザ側にすべての音を最後まで丁
寧に発声することを強いていたのに対し、音声補完にお
いては、単語や文節、文章等の断片を発声することによ
り入力できるため、心理的抵抗が少なく使いやすいとい
う効果がある。
る。
図である。
ャートである。
2)
Claims (14)
- 【請求項1】 ユーザの発声をシステムが認識するもの
において、ユーザの発する言語の断片に対し、システム
が残りの部分を補う音声補完方法。 - 【請求項2】 請求項1における音声補完方法におい
て、ユーザの意図的な有声休止をトリガーとして、シス
テムが残りの部分を補う音声補完方法。 - 【請求項3】 請求項1における音声補完方法におい
て、ユーザの意図的な有声休止を含む特定のキーワード
の発声により、該キーワードを任意の文字列とみなし、
システムがその前後の関係より前記キーワード部分を置
き換える音声補完方法。 - 【請求項4】 請求項1ないし3のいずれかに記載され
た音声補完方法において、補完候補が複数ある場合に
は、システムが補完候補一覧を画面に表示又は音声で読
み上げ、ユーザが音声、キーボード又はその他のデバイ
スを用いて選択し、補完候補が一つの場合には、システ
ムがユーザに画面表示や音声合成等により確認を求める
か、あるいは、自動的に最後まで入力する音声補完方
法。 - 【請求項5】 ユーザの発声をシステムが認識するもの
において、ユーザの発する言語の断片に対し、システム
が残りの部分を補完する音声補完装置。 - 【請求項6】 請求項5における音声補完装置におい
て、ユーザの意図的な有声休止をトリガーとして、シス
テムが残りの部分を補う音声補完装置。 - 【請求項7】 請求項5における音声補完装置におい
て、ユーザの意図的な有声休止を含む特定のキーワード
の発声により、該キーワードを任意の文字列とみなし、
システムがその前後の関係より前記キーワード部分を置
き換える音声補完装置。 - 【請求項8】 請求項5ないし7のいずれかに記載され
た音声補完装置において、補完候補が複数ある場合に
は、システムが補完候補一覧を画面に表示又は音声で読
み上げ、ユーザが音声、キーボード又はその他のデバイ
スを用いて選択し、補完候補が一つの場合には、システ
ムがユーザに画面表示や音声合成等により確認を求める
か、あるいは、自動的に最後まで入力する音声補完装
置。 - 【請求項9】 補完装置で実行されるプログラムを記録
した記録媒体において、前記プログラムは、 音声を入力する音声入力ステップと、 入力された音声を音声認識する音声認識ステップと、 前記音声認識ステップでの音声認識結果の中で補完する
元となる情報を与える単語断片を検出する検出ステップ
と、 当該検出された単語断片に基いて、前記音声認識ステッ
プでの音声認識結果を補完する補完処理ステップとを備
えたことを特徴とする記録媒体。 - 【請求項10】 請求項9に記載の記録媒体において、
前記検出ステップでは、前記音声入力ステップで入力さ
れた音声の中の有声休止区間を検出することにより、前
記単語断片を特定することを特徴とする記録媒体。 - 【請求項11】 請求項10に記載の記録媒体におい
て、前記単語断片は前記有声休止区間の前の音声認識結
果であることを特徴とする記録媒体。 - 【請求項12】 請求項9に記載の記録媒体において、
前記検出ステップでは、前記音声認識ステップでの音声
認識結果の中の予め定めた文字列を検出することによ
り、前記単語断片を特定することを特徴とする記録媒
体。 - 【請求項13】 請求項12に記載の記録媒体におい
て、前記単語断片は前記予め定めた文字列の後の音声認
識結果であることを特徴とする記録媒体。 - 【請求項14】 請求項9〜13のいずれかに記載の記
録媒体において、前記補完ステップにより前記単語断片
を補完するときに複数の補完候補が存在する場合には、
当該補完候補を選択する選択ステップをさらに備えたこ
とを特徴とする記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000380781A JP3581881B2 (ja) | 2000-07-13 | 2000-12-14 | 音声補完方法、装置および記録媒体 |
US09/749,743 US6876967B2 (en) | 2000-07-13 | 2000-12-28 | Speech complementing apparatus, method and recording medium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-212158 | 2000-07-13 | ||
JP2000212158 | 2000-07-13 | ||
JP2000380781A JP3581881B2 (ja) | 2000-07-13 | 2000-12-14 | 音声補完方法、装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002091492A true JP2002091492A (ja) | 2002-03-27 |
JP3581881B2 JP3581881B2 (ja) | 2004-10-27 |
Family
ID=26595926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000380781A Expired - Lifetime JP3581881B2 (ja) | 2000-07-13 | 2000-12-14 | 音声補完方法、装置および記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6876967B2 (ja) |
JP (1) | JP3581881B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140690A (ja) * | 2001-11-06 | 2003-05-16 | Denso Corp | 情報システム、電子機器、プログラム |
JP2005084422A (ja) * | 2003-09-09 | 2005-03-31 | Denso Corp | 音声認識検索装置 |
JP2012103840A (ja) * | 2010-11-09 | 2012-05-31 | Sony Corp | 情報処理装置、プログラムおよびコマンド生成方法 |
JP2013080015A (ja) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | 音声認識装置および音声認識方法 |
JP2014235356A (ja) * | 2013-06-04 | 2014-12-15 | アルパイン株式会社 | 音声認識を利用した候補選択装置および候補選択方法 |
JP2019133165A (ja) * | 2013-01-07 | 2019-08-08 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 対話型サーバ、ディスプレイ装置及びその制御方法 |
JP2019153133A (ja) * | 2018-03-05 | 2019-09-12 | オムロン株式会社 | 文字入力装置、文字入力方法、及び、文字入力プログラム |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6603835B2 (en) * | 1997-09-08 | 2003-08-05 | Ultratec, Inc. | System for text assisted telephony |
US7164753B2 (en) * | 1999-04-08 | 2007-01-16 | Ultratec, Incl | Real-time transcription correction system |
US8416925B2 (en) | 2005-06-29 | 2013-04-09 | Ultratec, Inc. | Device independent text captioned telephone service |
JP3892302B2 (ja) * | 2002-01-11 | 2007-03-14 | 松下電器産業株式会社 | 音声対話方法および装置 |
US8515024B2 (en) | 2010-01-13 | 2013-08-20 | Ultratec, Inc. | Captioned telephone service |
US11258900B2 (en) | 2005-06-29 | 2022-02-22 | Ultratec, Inc. | Device independent text captioned telephone service |
JP4827721B2 (ja) * | 2006-12-26 | 2011-11-30 | ニュアンス コミュニケーションズ,インコーポレイテッド | 発話分割方法、装置およびプログラム |
US20080235029A1 (en) * | 2007-03-23 | 2008-09-25 | Cross Charles W | Speech-Enabled Predictive Text Selection For A Multimodal Application |
JP2009288523A (ja) * | 2008-05-29 | 2009-12-10 | Toshiba Corp | 音声認識装置及びその方法 |
EP2871640B1 (en) * | 2012-07-09 | 2021-01-06 | LG Electronics, Inc. | Speech recognition apparatus and method |
US20180034961A1 (en) | 2014-02-28 | 2018-02-01 | Ultratec, Inc. | Semiautomated Relay Method and Apparatus |
US20180270350A1 (en) | 2014-02-28 | 2018-09-20 | Ultratec, Inc. | Semiautomated relay method and apparatus |
US10389876B2 (en) | 2014-02-28 | 2019-08-20 | Ultratec, Inc. | Semiautomated relay method and apparatus |
US10748523B2 (en) | 2014-02-28 | 2020-08-18 | Ultratec, Inc. | Semiautomated relay method and apparatus |
US10878721B2 (en) | 2014-02-28 | 2020-12-29 | Ultratec, Inc. | Semiautomated relay method and apparatus |
US10121471B2 (en) * | 2015-06-29 | 2018-11-06 | Amazon Technologies, Inc. | Language model speech endpointing |
JP6633008B2 (ja) * | 2017-02-01 | 2020-01-22 | ファーハット ロボティクス エービー | 音声対話装置及び音声対話方法 |
JP6696923B2 (ja) * | 2017-03-03 | 2020-05-20 | 国立大学法人京都大学 | 音声対話装置、その処理方法及びプログラム |
US11539900B2 (en) | 2020-02-21 | 2022-12-27 | Ultratec, Inc. | Caption modification and augmentation systems and methods for use by hearing assisted user |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271822A (ja) * | 1994-04-01 | 1995-10-20 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH0863185A (ja) * | 1994-08-24 | 1996-03-08 | Ricoh Co Ltd | 音声認識装置 |
JPH10222337A (ja) * | 1997-02-13 | 1998-08-21 | Meidensha Corp | コンピュータシステム |
JPH1195793A (ja) * | 1997-09-17 | 1999-04-09 | Toshiba Corp | 音声入力解釈装置及び音声入力解釈方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5884259A (en) * | 1997-02-12 | 1999-03-16 | International Business Machines Corporation | Method and apparatus for a time-synchronous tree-based search strategy |
JPH11305768A (ja) | 1998-04-22 | 1999-11-05 | Kawai Musical Instr Mfg Co Ltd | 電子楽器の残響効果付加装置 |
JP3252815B2 (ja) * | 1998-12-04 | 2002-02-04 | 日本電気株式会社 | 連続音声認識装置及び方法 |
-
2000
- 2000-12-14 JP JP2000380781A patent/JP3581881B2/ja not_active Expired - Lifetime
- 2000-12-28 US US09/749,743 patent/US6876967B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07271822A (ja) * | 1994-04-01 | 1995-10-20 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JPH0863185A (ja) * | 1994-08-24 | 1996-03-08 | Ricoh Co Ltd | 音声認識装置 |
JPH10222337A (ja) * | 1997-02-13 | 1998-08-21 | Meidensha Corp | コンピュータシステム |
JPH1195793A (ja) * | 1997-09-17 | 1999-04-09 | Toshiba Corp | 音声入力解釈装置及び音声入力解釈方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003140690A (ja) * | 2001-11-06 | 2003-05-16 | Denso Corp | 情報システム、電子機器、プログラム |
JP2005084422A (ja) * | 2003-09-09 | 2005-03-31 | Denso Corp | 音声認識検索装置 |
JP2012103840A (ja) * | 2010-11-09 | 2012-05-31 | Sony Corp | 情報処理装置、プログラムおよびコマンド生成方法 |
JP2013080015A (ja) * | 2011-09-30 | 2013-05-02 | Toshiba Corp | 音声認識装置および音声認識方法 |
JP2019133165A (ja) * | 2013-01-07 | 2019-08-08 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 対話型サーバ、ディスプレイ装置及びその制御方法 |
JP2014235356A (ja) * | 2013-06-04 | 2014-12-15 | アルパイン株式会社 | 音声認識を利用した候補選択装置および候補選択方法 |
JP2019153133A (ja) * | 2018-03-05 | 2019-09-12 | オムロン株式会社 | 文字入力装置、文字入力方法、及び、文字入力プログラム |
US11107474B2 (en) | 2018-03-05 | 2021-08-31 | Omron Corporation | Character input device, character input method, and character input program |
Also Published As
Publication number | Publication date |
---|---|
US6876967B2 (en) | 2005-04-05 |
US20020007275A1 (en) | 2002-01-17 |
JP3581881B2 (ja) | 2004-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3581881B2 (ja) | 音声補完方法、装置および記録媒体 | |
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
JP4444396B2 (ja) | 音声認識におけるポジション操作 | |
US5787230A (en) | System and method of intelligent Mandarin speech input for Chinese computers | |
US6415256B1 (en) | Integrated handwriting and speed recognition systems | |
JP4516112B2 (ja) | 音声認識プログラム | |
JP2001188777A (ja) | 音声をテキストに関連付ける方法、音声をテキストに関連付けるコンピュータ、コンピュータで文書を生成し読み上げる方法、文書を生成し読み上げるコンピュータ、コンピュータでテキスト文書の音声再生を行う方法、テキスト文書の音声再生を行うコンピュータ、及び、文書内のテキストを編集し評価する方法 | |
JPH03224055A (ja) | 同時通訳向き音声認識システムおよびその音声認識方法 | |
JP4729902B2 (ja) | 音声対話システム | |
Granell et al. | Multimodal crowdsourcing for transcribing handwritten documents | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
JP3795692B2 (ja) | 文字処理装置および方法 | |
CN112002304B (zh) | 语音合成方法及装置 | |
JPH10260976A (ja) | 音声対話方法 | |
JP3059504B2 (ja) | 品詞選択システム | |
JP2003162524A (ja) | 言語処理装置 | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
JP3958908B2 (ja) | 書き起こしテキスト自動生成装置、音声認識装置および記録媒体 | |
CN112786002B (zh) | 一种语音合成方法、装置、设备及存储介质 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2003288098A (ja) | ディクテーション装置、方法及びプログラム | |
JPH0634175B2 (ja) | 文章読上げ装置 | |
JPH09259145A (ja) | 検索方法および音声認識装置 | |
KR100212448B1 (ko) | 무제한 음성 명령어 인식기의 인식 성능 및 처리 속도 개선 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031224 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20040204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040316 |
|
R155 | Notification before disposition of declining of application |
Free format text: JAPANESE INTERMEDIATE CODE: R155 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3581881 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |