JP2001306091A - 音声認識システムおよび単語検索方法 - Google Patents
音声認識システムおよび単語検索方法Info
- Publication number
- JP2001306091A JP2001306091A JP2000125067A JP2000125067A JP2001306091A JP 2001306091 A JP2001306091 A JP 2001306091A JP 2000125067 A JP2000125067 A JP 2000125067A JP 2000125067 A JP2000125067 A JP 2000125067A JP 2001306091 A JP2001306091 A JP 2001306091A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictation
- dictionary
- voice
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 音声認識された文字列の修正を簡単な操作で
行なう。 【解決手段】 ディクテーション用辞書13にはディク
テーション認識のための単語が予め登録されている。話
者が発するディクテーション音声は音声入力装置11に
取り込まれ、音声認識部12はそれを解析し、ディクテ
ーション用辞書13を参照して文字列に変換する。単語
登録/検索処理部15は、それを表示装置16に表示す
る。同時に、表示された文字列に含まれるすべての単語
を検索用コマンド辞書14に登録する。次に、話者が表
示装置16の表示を見て、文字列を修正するときには、
当該音声を発すると、音声認識部12はそれを解析し、
検索用コマンド辞書14を参照して文字列に変換する。
単語登録/検索処理部15は、変換された文字列の表示
装置16における表示位置を指摘する。
行なう。 【解決手段】 ディクテーション用辞書13にはディク
テーション認識のための単語が予め登録されている。話
者が発するディクテーション音声は音声入力装置11に
取り込まれ、音声認識部12はそれを解析し、ディクテ
ーション用辞書13を参照して文字列に変換する。単語
登録/検索処理部15は、それを表示装置16に表示す
る。同時に、表示された文字列に含まれるすべての単語
を検索用コマンド辞書14に登録する。次に、話者が表
示装置16の表示を見て、文字列を修正するときには、
当該音声を発すると、音声認識部12はそれを解析し、
検索用コマンド辞書14を参照して文字列に変換する。
単語登録/検索処理部15は、変換された文字列の表示
装置16における表示位置を指摘する。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識、特に、
ディクテーション(dictation:口述)入力後に音声認
識結果を訂正等するのに好適な音声認識システムおよび
単語検索方法に関する。
ディクテーション(dictation:口述)入力後に音声認
識結果を訂正等するのに好適な音声認識システムおよび
単語検索方法に関する。
【0002】
【従来の技術】この種の従来技術の一例として、特開平
1-237597号公報に記載された「音声認識訂正装置」を挙
げることができる。この装置は、入力音声の成分を分析
する音響分析部と、音響分析部から出力された最初の入
力音声を第1の候補に基づいて認識する音声認識部と、
音声認識部の出力を表示する手段と、前記最初の入力音
声を記憶するとともに、次に訂正部分だけの音声が再入
力されたときそれが最初の入力音声のどの部分であるか
を判別し、訂正部分について次の候補を音声認識部に出
力する音声スポッティング部と、表示装置で表示された
次の候補が入力音声に合致している場合に入力音声の認
識を確定する手段とを構成要素とする。この結果、音声
で入力され表示された文字列文章中に認識誤りがあった
場合に、使用者は、誤認識部分の始端および終端をカー
ソルによって指示するという繁雑な操作を行なわずに音
声の認識訂正を行なえるようになる。
1-237597号公報に記載された「音声認識訂正装置」を挙
げることができる。この装置は、入力音声の成分を分析
する音響分析部と、音響分析部から出力された最初の入
力音声を第1の候補に基づいて認識する音声認識部と、
音声認識部の出力を表示する手段と、前記最初の入力音
声を記憶するとともに、次に訂正部分だけの音声が再入
力されたときそれが最初の入力音声のどの部分であるか
を判別し、訂正部分について次の候補を音声認識部に出
力する音声スポッティング部と、表示装置で表示された
次の候補が入力音声に合致している場合に入力音声の認
識を確定する手段とを構成要素とする。この結果、音声
で入力され表示された文字列文章中に認識誤りがあった
場合に、使用者は、誤認識部分の始端および終端をカー
ソルによって指示するという繁雑な操作を行なわずに音
声の認識訂正を行なえるようになる。
【0003】
【発明が解決しようとする課題】しかしながら、上述し
た従来技術では、使用者が音声の認識訂正をするときに
は、訂正キーを押下後に、訂正部分だけの音声を再入力
するようにしているため、訂正するときの操作(訂正キ
ー押下)が面倒であるという問題点がある。
た従来技術では、使用者が音声の認識訂正をするときに
は、訂正キーを押下後に、訂正部分だけの音声を再入力
するようにしているため、訂正するときの操作(訂正キ
ー押下)が面倒であるという問題点がある。
【0004】本発明の目的は、音声認識の誤り訂正を簡
単な操作で行なえる音声認識システムおよび単語検索方
法を提供することにある。
単な操作で行なえる音声認識システムおよび単語検索方
法を提供することにある。
【0005】
【課題を解決するための手段】第1の本発明の音声認識
システムは、ディクテーション入力された音声から認識
した文字列をすべて単語単位で検索用コマンドとして辞
書に登録しておき、該単語を音声入力することによって
前記辞書から対応する単語を検索できるようにしたこと
を特徴とする。
システムは、ディクテーション入力された音声から認識
した文字列をすべて単語単位で検索用コマンドとして辞
書に登録しておき、該単語を音声入力することによって
前記辞書から対応する単語を検索できるようにしたこと
を特徴とする。
【0006】第2の本発明の音声認識システムは、ディ
クテーション認識のための単語が予め登録されているデ
ィクテーション用辞書(13)と、検索用コマンドが登
録される検索用コマンド辞書(14)と、話者が発する
ディクテーション音声または検索音声を取り込む音声入
力装置(11)と、該取り込まれた音声を解析し前記デ
ィクテーション用辞書(13)または前記検索用コマン
ド辞書(14)を参照して文字列に変換する音声認識部
(12)と、前記ディクテーション用辞書を参照して変
換された文字列を表示するための表示装置(16)と、
該表示を行なうとともに、表示された文字列に含まれる
すべての単語を前記検索用コマンド辞書(14)に登録
し、また前記検索用コマンド辞書(14)を参照して変
換された文字列の前記表示における位置を指摘する単語
登録/検索処理部(15)とを含むことを特徴とする。
クテーション認識のための単語が予め登録されているデ
ィクテーション用辞書(13)と、検索用コマンドが登
録される検索用コマンド辞書(14)と、話者が発する
ディクテーション音声または検索音声を取り込む音声入
力装置(11)と、該取り込まれた音声を解析し前記デ
ィクテーション用辞書(13)または前記検索用コマン
ド辞書(14)を参照して文字列に変換する音声認識部
(12)と、前記ディクテーション用辞書を参照して変
換された文字列を表示するための表示装置(16)と、
該表示を行なうとともに、表示された文字列に含まれる
すべての単語を前記検索用コマンド辞書(14)に登録
し、また前記検索用コマンド辞書(14)を参照して変
換された文字列の前記表示における位置を指摘する単語
登録/検索処理部(15)とを含むことを特徴とする。
【0007】前記単語登録/検索処理部(15)は、前
記音声認識部(12)からディクテーションの認識結果
通知を受け付けるディクテーション結果受付け部(15
1)と、前記音声認識部(12)から検索コマンドの認
識結果通知を受け付ける検索用コマンド結果受付け部
(152)と、ディクテーション認識の結果として通知
された文字列に含まれるすべての単語について、単語単
位でそれぞれ表記情報および読み方情報と、前記表示装
置における表示開始位置情報および表示終了位置情報と
を保持する単語情報データベース部(153)と、該単
語情報データベース部(153)に保持している表記情
報および読み方情報を音声で検索できるように、単語ご
とに前記検索用コマンド辞書に登録する辞書登録部(1
54)と、前記検索用コマンド結果受付け部(152)
に通知された検索コマンドの読み方情報をキーとして前
記単語情報データベース部(153)を参照し単語の表
示位置を検索する単語検索部(155)と、前記表示装
置(16)における該単語の表示位置にカーソルを位置
付ける単語位置付け部(156)とで構成されることを
特徴とする。
記音声認識部(12)からディクテーションの認識結果
通知を受け付けるディクテーション結果受付け部(15
1)と、前記音声認識部(12)から検索コマンドの認
識結果通知を受け付ける検索用コマンド結果受付け部
(152)と、ディクテーション認識の結果として通知
された文字列に含まれるすべての単語について、単語単
位でそれぞれ表記情報および読み方情報と、前記表示装
置における表示開始位置情報および表示終了位置情報と
を保持する単語情報データベース部(153)と、該単
語情報データベース部(153)に保持している表記情
報および読み方情報を音声で検索できるように、単語ご
とに前記検索用コマンド辞書に登録する辞書登録部(1
54)と、前記検索用コマンド結果受付け部(152)
に通知された検索コマンドの読み方情報をキーとして前
記単語情報データベース部(153)を参照し単語の表
示位置を検索する単語検索部(155)と、前記表示装
置(16)における該単語の表示位置にカーソルを位置
付ける単語位置付け部(156)とで構成されることを
特徴とする。
【0008】なお、前記音声認識部は、発声される音声
の連続性によって、前記ディクテーション音声と検索音
声を区別する。また、前記検索用コマンド辞書に単語を
登録するときに所定の語を付加しておき、前記検索音声
を発声するときには該所定の語を付加することによっ
て、前記ディクテーション音声と検索音声を区別しても
よい。
の連続性によって、前記ディクテーション音声と検索音
声を区別する。また、前記検索用コマンド辞書に単語を
登録するときに所定の語を付加しておき、前記検索音声
を発声するときには該所定の語を付加することによっ
て、前記ディクテーション音声と検索音声を区別しても
よい。
【0009】本発明では、ディクテーション認識のため
の単語をディクテーション用辞書に予め登録しておく。
そして、話者がディクテーション音声を発するとそれを
取り込む。取り込んだ音声を解析しディクテーション用
辞書を参照して文字列に変換し、変換された文字列を表
示装置に表示する。また、表示された文字列に含まれる
すべての単語を検索用コマンド辞書に登録する。次に、
話者が検索音声を発するとそれを取り込み、取り込んだ
音声を解析し検索用コマンド辞書を参照して文字列に変
換する。最後に、変換された文字列の表示装置における
表示位置を指摘する。このように、本発明による単語検
索方法は、ディクテーション入力している文章の認識し
たすべての単語を検索用コマンド辞書に検索キーとして
登録し、ディクテーション入力後の単語を音声により検
索を可能にするものである。
の単語をディクテーション用辞書に予め登録しておく。
そして、話者がディクテーション音声を発するとそれを
取り込む。取り込んだ音声を解析しディクテーション用
辞書を参照して文字列に変換し、変換された文字列を表
示装置に表示する。また、表示された文字列に含まれる
すべての単語を検索用コマンド辞書に登録する。次に、
話者が検索音声を発するとそれを取り込み、取り込んだ
音声を解析し検索用コマンド辞書を参照して文字列に変
換する。最後に、変換された文字列の表示装置における
表示位置を指摘する。このように、本発明による単語検
索方法は、ディクテーション入力している文章の認識し
たすべての単語を検索用コマンド辞書に検索キーとして
登録し、ディクテーション入力後の単語を音声により検
索を可能にするものである。
【0010】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
て図面を参照して説明する。
【0011】図1を参照すると、本発明の一実施の形態
は、話者が発する音声を取り込む音声入力装置11と、
入力された音声を解析し文字列に変換する音声認識部1
2と、音声入力装置11から取り込んだ音声を音声認識
部12が文字列に変換するために参照するディクテーシ
ョン用辞書13と、ディクテーション認識の結果として
表示されている文字列を音声認識部12が検索コマンド
として認識するために参照する検索用コマンド辞書14
と、音声認識部12から通知される認識した文字列を処
理する単語登録/検索処理部15と、ディクテーション
認識の結果を表示する表示装置16とを含む。ディクテ
ーション用辞書13には、ディクテーション認識のため
の単語が予め登録されている。また、検索用コマンド辞
書14には、ディクテーション入力された音声に含まれ
る単語がすべて登録される。
は、話者が発する音声を取り込む音声入力装置11と、
入力された音声を解析し文字列に変換する音声認識部1
2と、音声入力装置11から取り込んだ音声を音声認識
部12が文字列に変換するために参照するディクテーシ
ョン用辞書13と、ディクテーション認識の結果として
表示されている文字列を音声認識部12が検索コマンド
として認識するために参照する検索用コマンド辞書14
と、音声認識部12から通知される認識した文字列を処
理する単語登録/検索処理部15と、ディクテーション
認識の結果を表示する表示装置16とを含む。ディクテ
ーション用辞書13には、ディクテーション認識のため
の単語が予め登録されている。また、検索用コマンド辞
書14には、ディクテーション入力された音声に含まれ
る単語がすべて登録される。
【0012】単語登録/検索処理部15は、音声認識部
12からディクテーションの認識結果通知を受け付ける
ためのディクテーション結果受付け部151と、音声認
識部12から検索キーの認識結果通知を受け付けるため
の検索用コマンド結果受付け部152と、ディクテーシ
ョン認識の結果として通知されたすべての単語につい
て、単語単位でそれぞれ表記情報および読み方情報と、
表示装置16に表示した時の表示開始位置情報および表
示終了位置情報を保持する単語情報データベース部15
3と、単語情報データベース部153に保持している表
記情報および読み方情報を音声で検索できるように、単
語ごとに検索用コマンド辞書14に登録する辞書登録部
154と、検索用コマンド結果受付け部152に通知さ
れた検索コマンドの読み方情報をキーとして単語情報
データベース部153を参照し単語の表示位置を検索す
る単語検索部155と、単語検索部155が検索した単
語表示位置にカーソルを位置付ける単語位置付け部15
6とを備えている。
12からディクテーションの認識結果通知を受け付ける
ためのディクテーション結果受付け部151と、音声認
識部12から検索キーの認識結果通知を受け付けるため
の検索用コマンド結果受付け部152と、ディクテーシ
ョン認識の結果として通知されたすべての単語につい
て、単語単位でそれぞれ表記情報および読み方情報と、
表示装置16に表示した時の表示開始位置情報および表
示終了位置情報を保持する単語情報データベース部15
3と、単語情報データベース部153に保持している表
記情報および読み方情報を音声で検索できるように、単
語ごとに検索用コマンド辞書14に登録する辞書登録部
154と、検索用コマンド結果受付け部152に通知さ
れた検索コマンドの読み方情報をキーとして単語情報
データベース部153を参照し単語の表示位置を検索す
る単語検索部155と、単語検索部155が検索した単
語表示位置にカーソルを位置付ける単語位置付け部15
6とを備えている。
【0013】次に、図1および図2を参照して本実施の
形態の動作について詳細に説明する。
形態の動作について詳細に説明する。
【0014】先ず、話者が音声を発すると、その音声は
音声入力装置11に取り込まれる(図2のステップA
1)。そして、音声入力装置11から入力された音声
は、音声認識部12においてディクテーション用辞書1
3または検索用コマンド辞書14を参照して文字列に変
換される(ステップA1およびステップA2)。音声認
識部12がディクテーション用辞書13と検索用コマン
ド辞書14のいずれを参照するかは、入力される音声が
ディクテーション音声であるか否かによる。そのための
方法の一つは、ディクテーションの場合には話者が連続
して音声入力し、検索の場合には途切れ途切れに単語を
入力するようにするやり方である。他の有力な方法は後
述する。
音声入力装置11に取り込まれる(図2のステップA
1)。そして、音声入力装置11から入力された音声
は、音声認識部12においてディクテーション用辞書1
3または検索用コマンド辞書14を参照して文字列に変
換される(ステップA1およびステップA2)。音声認
識部12がディクテーション用辞書13と検索用コマン
ド辞書14のいずれを参照するかは、入力される音声が
ディクテーション音声であるか否かによる。そのための
方法の一つは、ディクテーションの場合には話者が連続
して音声入力し、検索の場合には途切れ途切れに単語を
入力するようにするやり方である。他の有力な方法は後
述する。
【0015】音声認識部12は、ディクテーション用辞
書13を参照して音声を変換した場合にはディクテーシ
ョン結果受付け部151に認識結果を通知し、検索用コ
マンド辞書14を参照して音声を変換した場合には検索
用コマンド結果受付け部152に認識結果を通知する。
それにより、ディクテーション結果受付け部151に認
識結果が通知された場合にはディクテーション認識結果
であると判断することが可能である(図2のステップA
3)。
書13を参照して音声を変換した場合にはディクテーシ
ョン結果受付け部151に認識結果を通知し、検索用コ
マンド辞書14を参照して音声を変換した場合には検索
用コマンド結果受付け部152に認識結果を通知する。
それにより、ディクテーション結果受付け部151に認
識結果が通知された場合にはディクテーション認識結果
であると判断することが可能である(図2のステップA
3)。
【0016】ディクテーション結果受付け部151に通
知されたディクテーション認識結果には表記情報だけで
はなく読み方情報が付加されているので、単語情報デー
タベース部153でディクテーション認識したすべての
単語について、表記情報および読み方情報と、表示装置
16に出力した時の表示開始位置および表示終了位置と
を単語ごとに関連付けて単語情報データベース部153
で保持する(ステップA4)。辞書登録部154は、単
語情報データベース部153に保持しているすべての単
語について、音声で検索を可能にするために読み方情報
を単語単位で検索用コマンド辞書14に登録する(ステ
ップA5)。その後、単語情報データベース部153に
保持しているディクテーション認識の結果を表示装置1
6に表示する(ステップA6)。
知されたディクテーション認識結果には表記情報だけで
はなく読み方情報が付加されているので、単語情報デー
タベース部153でディクテーション認識したすべての
単語について、表記情報および読み方情報と、表示装置
16に出力した時の表示開始位置および表示終了位置と
を単語ごとに関連付けて単語情報データベース部153
で保持する(ステップA4)。辞書登録部154は、単
語情報データベース部153に保持しているすべての単
語について、音声で検索を可能にするために読み方情報
を単語単位で検索用コマンド辞書14に登録する(ステ
ップA5)。その後、単語情報データベース部153に
保持しているディクテーション認識の結果を表示装置1
6に表示する(ステップA6)。
【0017】一方、図2のステップA3において、検索
用コマンド結果受付け部152に認識結果が通知された
場合は、その認識結果は検索コマンドの認識結果である
ので、認識結果は検索用コマンド受付け部152から単
語検索部155に渡される。単語検索部155では、検
索コマンドとして認識された結果文字列の読み方情報を
キーとして単語情報データベース部153を参照し、同
じ読み方情報を持つ単語を検索する(ステップA7)。
同じ読み方情報を持つ単語を検出した場合、さらに単語
情報データベース部153を参照して検索された単語の
表示開始位置および表示終了位置を取り出し、単語位置
付け部156で表示開始位置から表示終了位置までを選
択状態に設定した後、表示装置16に表示する(ステッ
プA8)。
用コマンド結果受付け部152に認識結果が通知された
場合は、その認識結果は検索コマンドの認識結果である
ので、認識結果は検索用コマンド受付け部152から単
語検索部155に渡される。単語検索部155では、検
索コマンドとして認識された結果文字列の読み方情報を
キーとして単語情報データベース部153を参照し、同
じ読み方情報を持つ単語を検索する(ステップA7)。
同じ読み方情報を持つ単語を検出した場合、さらに単語
情報データベース部153を参照して検索された単語の
表示開始位置および表示終了位置を取り出し、単語位置
付け部156で表示開始位置から表示終了位置までを選
択状態に設定した後、表示装置16に表示する(ステッ
プA8)。
【0018】次に、具体的なディクテーション例により
本発明を更に詳細に説明する。話者がまだ何も発生して
いない当初の状態では、単語情報データベース部153
および検索用コマンド辞書14には何も登録されていな
いし、表示装置16は何も表示していない。
本発明を更に詳細に説明する。話者がまだ何も発生して
いない当初の状態では、単語情報データベース部153
および検索用コマンド辞書14には何も登録されていな
いし、表示装置16は何も表示していない。
【0019】いま、話者が発声し音声入力装置11か
ら、「きょうはよいてんきです」との発声が入力された
場合、音声認識部12は、ディクテーション用辞書13
を参照する。このとき、話者の発した音声がディクテー
ション音声ではなく検索音声である時には、「をしゅう
せい」との音声を付加するようにする。これによって、
音声認識部12はディクテーション用辞書13ではな
く、検索用コマンド辞書14を参照するようにできる。
きょうはよいてんきです」には「をしゅうせい」との音
声が付加されていないので、ディクテーション音声であ
るから、音声認識部12は、ディクテーション用辞書1
3を参照することによってディクテーション認識した結
果をディクテーション結果受付け部151に通知する。
ら、「きょうはよいてんきです」との発声が入力された
場合、音声認識部12は、ディクテーション用辞書13
を参照する。このとき、話者の発した音声がディクテー
ション音声ではなく検索音声である時には、「をしゅう
せい」との音声を付加するようにする。これによって、
音声認識部12はディクテーション用辞書13ではな
く、検索用コマンド辞書14を参照するようにできる。
きょうはよいてんきです」には「をしゅうせい」との音
声が付加されていないので、ディクテーション音声であ
るから、音声認識部12は、ディクテーション用辞書1
3を参照することによってディクテーション認識した結
果をディクテーション結果受付け部151に通知する。
【0020】単語情報データベース部153には、単語
単位に、読み方情報,表記情報および位置情報が関連付
けられて登録され保存される。このとき、話者の意図は
「今日はよい天気です」であるが、音声認識部12で
「今日はよい電気です」と誤認識した場合には、図3に
示すように、正しい読み方情報「てんき」ではなく誤認
識された読み方情報「でんき」、および正しい表記情報
「天気」ではなく、誤認識された表記情報「電気」が登
録される。
単位に、読み方情報,表記情報および位置情報が関連付
けられて登録され保存される。このとき、話者の意図は
「今日はよい天気です」であるが、音声認識部12で
「今日はよい電気です」と誤認識した場合には、図3に
示すように、正しい読み方情報「てんき」ではなく誤認
識された読み方情報「でんき」、および正しい表記情報
「天気」ではなく、誤認識された表記情報「電気」が登
録される。
【0021】辞書登録部154は、単語情報データベー
ス部153に登録された上述の情報の内、読み方情報を
検索用コマンド辞書14に登録する。図4はその登録内
容を示す。図4を参照すると明らかなように、各読み方
情報には、単語情報データベース部153中の読み方情
報に「を修正」との文字列が付加されている。これは、
音声認識部12は話者からの発声に「をしゅうせい」が
付加されていると、前述のように、音声認識するために
検索用コマンド辞書14を参照するが、そのときの一致
検出を容易化するための措置である。
ス部153に登録された上述の情報の内、読み方情報を
検索用コマンド辞書14に登録する。図4はその登録内
容を示す。図4を参照すると明らかなように、各読み方
情報には、単語情報データベース部153中の読み方情
報に「を修正」との文字列が付加されている。これは、
音声認識部12は話者からの発声に「をしゅうせい」が
付加されていると、前述のように、音声認識するために
検索用コマンド辞書14を参照するが、そのときの一致
検出を容易化するための措置である。
【0022】このときの表示装置16には図5に示すよ
うに「今日はよい電気です」と表示される。
うに「今日はよい電気です」と表示される。
【0023】次に、表示装置16における表示を見てデ
ィクテーション入力が誤認識されたのに気づいた話者
が、誤認識された「電気」の部分を修正するには、「で
んきをしゅうせい」と発声する。音声認識部12は、ま
ず検索用コマンド辞書14を参照する。すると、そこに
は、図4に示したように「でんきを修正」というコマン
ドが存在するので、話者の発声「でんきをしゅうせい」
をコマンドとして認識し、検索用コマンド結果受付け部
152に通知する。
ィクテーション入力が誤認識されたのに気づいた話者
が、誤認識された「電気」の部分を修正するには、「で
んきをしゅうせい」と発声する。音声認識部12は、ま
ず検索用コマンド辞書14を参照する。すると、そこに
は、図4に示したように「でんきを修正」というコマン
ドが存在するので、話者の発声「でんきをしゅうせい」
をコマンドとして認識し、検索用コマンド結果受付け部
152に通知する。
【0024】検索用コマンド結果受付け部152は、
「でんきをしゅうせい」から「をしゅうせい」の部分を
除いた「でんき」を単語検索部155に渡す。単語検索
部155は「でんき」という読み方で単語情報データベ
ース部153に対して検索を行う。単語情報データベー
ス部153における保持内容は、図3に示したとおりで
あり、「でんき」についてマッチングする。そこで、単
語情報検索部155は、「でんき」に関連付けられてい
る位置情報を求め、単語位置付け部156は表示装置1
6の始端5と終端7に表示されている文字列「電気」を
明暗反転し、「電気」に対する他の候補文字列を図6に
示すように表示する。
「でんきをしゅうせい」から「をしゅうせい」の部分を
除いた「でんき」を単語検索部155に渡す。単語検索
部155は「でんき」という読み方で単語情報データベ
ース部153に対して検索を行う。単語情報データベー
ス部153における保持内容は、図3に示したとおりで
あり、「でんき」についてマッチングする。そこで、単
語情報検索部155は、「でんき」に関連付けられてい
る位置情報を求め、単語位置付け部156は表示装置1
6の始端5と終端7に表示されている文字列「電気」を
明暗反転し、「電気」に対する他の候補文字列を図6に
示すように表示する。
【0025】話者が、表示された他の候補文字列の中か
ら「天気」を選択すると、表示装置16における「電
気」の表示は「天気」に置き換わり(図9)、同時に、
単語情報データベース部153および検索用コマンド辞
書14にも反映される(図7,図8)。
ら「天気」を選択すると、表示装置16における「電
気」の表示は「天気」に置き換わり(図9)、同時に、
単語情報データベース部153および検索用コマンド辞
書14にも反映される(図7,図8)。
【0026】なお、以上に説明した単語検索方法をコン
ピュータに実行させるためのプログラムを半導体メモ
リ,フロッピー(登録商標)ディスク,CD−ROM等
の記録媒体に記録し、単語登録/検索処理部15を構成
するコンピュータに読み込ませて実行させるようにして
もよい。そのプログラムはコンピュータを制御し、ディ
クテーション結果受付け部151,検索用コマンド結果
受付け部152,単語情報データベース部153,辞書
登録部154,単語検索部155および単語位置付け部
156として機能させる。
ピュータに実行させるためのプログラムを半導体メモ
リ,フロッピー(登録商標)ディスク,CD−ROM等
の記録媒体に記録し、単語登録/検索処理部15を構成
するコンピュータに読み込ませて実行させるようにして
もよい。そのプログラムはコンピュータを制御し、ディ
クテーション結果受付け部151,検索用コマンド結果
受付け部152,単語情報データベース部153,辞書
登録部154,単語検索部155および単語位置付け部
156として機能させる。
【0027】
【発明の効果】本発明の効果は、ディクテーションと検
索コマンドとを特に意識することもなく、表示されてい
る単語を音声入力装置に向かって発声するだけで、読み
上げた単語にカーソルが位置付くことにある。その理由
は、ディクテーション認識された文字列が表示された時
点ですべての単語が検索用コマンド辞書に自動的に登録
され、音声コマンドとして利用することが可能になって
いるためである。
索コマンドとを特に意識することもなく、表示されてい
る単語を音声入力装置に向かって発声するだけで、読み
上げた単語にカーソルが位置付くことにある。その理由
は、ディクテーション認識された文字列が表示された時
点ですべての単語が検索用コマンド辞書に自動的に登録
され、音声コマンドとして利用することが可能になって
いるためである。
【図1】本発明の実施例の構成を示すブロック図
【図2】本発明の実施例の動作を示す流れ図
【図3】誤認識されたディクテーション音声例に対する
単語情報データベース部の保持内容を示す図
単語情報データベース部の保持内容を示す図
【図4】図3の単語情報データベース部の内容に対応す
る辞書の検索用コマンド登録内容を示す図
る辞書の検索用コマンド登録内容を示す図
【図5】図3の単語情報データベース部の内容に対応す
る表示装置における表示画面図
る表示装置における表示画面図
【図6】図5の表示を修正するときの表示装置における
表示画面図
表示画面図
【図7】修正後の単語情報データベース部の保持内容を
示す図
示す図
【図8】修正後の検索用コマンド登録内容を示す図
【図9】修正後の表示装置における表示画面図
11 音声入力装置 12 音声認識部 13 ディクテーション用辞書 14 検索用コマンド辞書 15 単語登録/検索処理部 16 表示装置 151 ディクテーション結果受付け部 152 検索用コマンド結果受付け部 153 単語情報データベース部 154 辞書登録部 155 単語検索部 156 単語位置付け部
Claims (9)
- 【請求項1】 ディクテーション入力された音声から認
識した文字列をすべて単語単位で検索用コマンドとして
辞書に登録しておき、該単語を音声入力することによっ
て前記辞書から対応する単語を検索できるようにしたこ
とを特徴とする音声認識システム。 - 【請求項2】 ディクテーション入力された音声から認
識した文字列をすべて単語単位で表記情報,読み方情
報,表示開始位置および表示終了位置について関連付け
てデータベースに保持することを特徴とする請求項1に
記載の音声認識システム。 - 【請求項3】 前記辞書に保持した単語を前記検索用コ
マンドとして認識したときに、前記表示開始位置から前
記表示終了位置までカーソルを位置付けることを特徴と
する請求項2に記載の音声認識システム。 - 【請求項4】 ディクテーション認識のための単語が予
め登録されているディクテーション用辞書と、 検索用コマンドが登録される検索用コマンド辞書と、 話者が発するディクテーション音声または検索音声を取
り込む音声入力装置と、 該取り込まれた音声を解析し前記ディクテーション用辞
書または前記検索用コマンド辞書を参照して文字列に変
換する音声認識部と、 前記ディクテーション用辞書を参照して変換された文字
列を表示するための表示装置と、 該表示を行なうとともに、表示された文字列に含まれる
すべての単語を前記検索用コマンド辞書に登録し、また
前記検索用コマンド辞書を参照して変換された文字列の
前記表示における位置を指摘する単語登録/検索処理部
とを含むことを特徴とする音声認識システム。 - 【請求項5】 前記単語登録/検索処理部は、 前記音声認識部からディクテーションの認識結果通知を
受け付けるディクテーション結果受付け部と、 前記音声認識部から検索コマンドの認識結果通知を受け
付ける検索用コマンド結果受付け部と、 ディクテーション認識の結果として通知された文字列に
含まれるすべての単語について、単語単位でそれぞれ表
記情報および読み方情報と、前記表示装置における表示
開始位置情報および表示終了位置情報とを保持する単語
情報データベース部と、 該単語情報データベース部に保持している表記情報およ
び読み方情報を音声で検索できるように、単語ごとに前
記検索用コマンド辞書に登録する辞書登録部と、 前記検索用コマンド結果受付け部に通知された検索コマ
ンドの読み方情報をキーとして前記単語情報データベー
ス部を参照し単語の表示位置を検索する単語検索部と、 前記表示装置における該単語の表示位置にカーソルを位
置付ける単語位置付け部とで構成されることを特徴とす
る請求項4に記載の音声認識システム。 - 【請求項6】 前記音声認識部は、発声される音声の連
続性によって、前記ディクテーション音声と検索音声を
区別することを特徴とする請求項3ないし請求項5のい
ずれかに記載の音声認識システム。 - 【請求項7】 前記検索用コマンド辞書に単語を登録す
るときに所定の語を付加しておき、前記検索音声を発声
するときには該所定の語を付加することによって、前記
音声認識部は前記ディクテーション音声と検索音声を区
別することを特徴とする請求項3ないし請求項5のいず
れかに記載の音声認識システム。 - 【請求項8】 ディクテーション認識のための単語をデ
ィクテーション用辞書に予め登録しておく手順と、 話者が発するディクテーション音声を取り込む手順と、 該取り込まれた音声を解析し前記ディクテーション用辞
書を参照して文字列に変換する手順と、 該変換された文字列を表示装置に表示する手順と、 該表示された文字列に含まれるすべての単語を検索用コ
マンド辞書に登録する手順と、 話者が発する検索音声を取り込む手順と、 該取り込まれた音声を解析し前記検索用コマンド辞書を
参照して文字列に変換する手順と、 該変換された文字列の前記表示装置における表示位置を
指摘する手順とを含むことを特徴とする単語検索方法。 - 【請求項9】 ディクテーション認識のための単語が予
め登録されているディクテーション用辞書と、 検索用コマンドが登録される検索用コマンド辞書と、 話者が発するディクテーション音声または検索音声を取
り込む音声入力装置と、 該取り込まれた音声を解析し前記ディクテーション用辞
書または前記検索用コマンド辞書を参照して文字列に変
換する音声認識部と、 前記ディクテーション用辞書を参照して変換された文字
列を表示するための表示装置とを備えた音声認識システ
ムを構成するコンピュータに、 前記音声認識部からディクテーションの認識結果通知を
受け付ける処理と、 前記音声認識部から検索コマンドの認識結果通知を受け
付ける処理と、 ディクテーション認識の結果として通知された文字列に
含まれるすべての単語について、単語単位でそれぞれ表
記情報および読み方情報と、前記表示装置における表示
開始位置情報および表示終了位置情報とを前記単語情報
データベース部に保持させる処理と、 該単語情報データベース部に保持している表記情報およ
び読み方情報を音声で検索できるように、単語ごとに前
記検索用コマンド辞書に登録させる処理と、 前記検索用コマンド結果受付け部に通知された検索コマ
ンドの読み方情報をキーとして前記単語情報データベー
ス部を参照し単語の表示位置を検索する処理と、 前記表示装置における該単語の表示位置にカーソルを位
置付ける処理とを行なわせるプログラムを記録した記録
媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000125067A JP2001306091A (ja) | 2000-04-26 | 2000-04-26 | 音声認識システムおよび単語検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000125067A JP2001306091A (ja) | 2000-04-26 | 2000-04-26 | 音声認識システムおよび単語検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001306091A true JP2001306091A (ja) | 2001-11-02 |
Family
ID=18635085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000125067A Pending JP2001306091A (ja) | 2000-04-26 | 2000-04-26 | 音声認識システムおよび単語検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001306091A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006119625A (ja) * | 2004-10-22 | 2006-05-11 | Microsoft Corp | 音声認識における動詞誤りの回復 |
JP2006164237A (ja) * | 2004-12-03 | 2006-06-22 | Microsoft Corp | 話者照会および逆チューリングテストの組合せによるユーザー認証 |
JP2007248886A (ja) * | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
JP2012521608A (ja) * | 2009-03-25 | 2012-09-13 | マイクロソフト コーポレーション | アプリケーションのための共有可能な分散型辞書 |
WO2013128508A1 (ja) | 2012-02-27 | 2013-09-06 | Necカシオモバイルコミュニケーションズ株式会社 | 音声入力装置、音声入力方法及びプログラム |
WO2015156011A1 (ja) * | 2014-04-08 | 2015-10-15 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
-
2000
- 2000-04-26 JP JP2000125067A patent/JP2001306091A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006119625A (ja) * | 2004-10-22 | 2006-05-11 | Microsoft Corp | 音声認識における動詞誤りの回復 |
US8725505B2 (en) | 2004-10-22 | 2014-05-13 | Microsoft Corporation | Verb error recovery in speech recognition |
JP2006164237A (ja) * | 2004-12-03 | 2006-06-22 | Microsoft Corp | 話者照会および逆チューリングテストの組合せによるユーザー認証 |
US8255223B2 (en) | 2004-12-03 | 2012-08-28 | Microsoft Corporation | User authentication by combining speaker verification and reverse turing test |
US8457974B2 (en) | 2004-12-03 | 2013-06-04 | Microsoft Corporation | User authentication by combining speaker verification and reverse turing test |
JP2007248886A (ja) * | 2006-03-16 | 2007-09-27 | Mitsubishi Electric Corp | 読み修正装置 |
JP4704254B2 (ja) * | 2006-03-16 | 2011-06-15 | 三菱電機株式会社 | 読み修正装置 |
JP2012521608A (ja) * | 2009-03-25 | 2012-09-13 | マイクロソフト コーポレーション | アプリケーションのための共有可能な分散型辞書 |
WO2013128508A1 (ja) | 2012-02-27 | 2013-09-06 | Necカシオモバイルコミュニケーションズ株式会社 | 音声入力装置、音声入力方法及びプログラム |
US9842589B2 (en) | 2012-02-27 | 2017-12-12 | Nec Corporation | Voice input device, voice input method and program |
WO2015156011A1 (ja) * | 2014-04-08 | 2015-10-15 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3662780B2 (ja) | 自然言語を用いた対話システム | |
KR100735820B1 (ko) | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
US6735565B2 (en) | Select a recognition error by comparing the phonetic | |
Ogata et al. | Speech repair: quick error correction just by using selection operation for speech input interfaces. | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JPWO2008114811A1 (ja) | 情報検索システム、情報検索方法及び情報検索用プログラム | |
TW201337911A (zh) | 電子裝置以及語音識別方法 | |
JP2006267319A (ja) | 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置 | |
JP2001092496A (ja) | 連続音声認識装置および記録媒体 | |
US20070016420A1 (en) | Dictionary lookup for mobile devices using spelling recognition | |
US10789946B2 (en) | System and method for speech recognition with decoupling awakening phrase | |
JP2018063271A (ja) | 音声対話装置、音声対話システム、および、音声対話装置の制御方法 | |
US20050071170A1 (en) | Dissection of utterances into commands and voice data | |
JP5897718B2 (ja) | 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法 | |
JP2001306091A (ja) | 音声認識システムおよび単語検索方法 | |
JP2010009446A (ja) | 音声ファイルの検索システム、方法及びプログラム | |
US20050125224A1 (en) | Method and apparatus for fusion of recognition results from multiple types of data sources | |
JP2000056795A (ja) | 音声認識装置 | |
JP2002215184A (ja) | 音声認識装置、及びプログラム | |
JP2003162524A (ja) | 言語処理装置 | |
US20210064640A1 (en) | Information processing apparatus and information processing method | |
US20240355326A1 (en) | Speech input support device and storage medium | |
JP2008107641A (ja) | 音声データ検索装置 | |
JP5336788B2 (ja) | 音声認識装置およびプログラム |