JP3438869B2

JP3438869B2 - 音声認識システム、方法及び記録媒体

Info

Publication number: JP3438869B2
Application number: JP31693899A
Authority: JP
Inventors: 広樹谷岡
Original assignee: 株式会社ジャストシステム
Priority date: 1999-11-08
Filing date: 1999-11-08
Publication date: 2003-08-18
Anticipated expiration: 2019-11-08
Also published as: JP2001134290A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識システ
ム、方法及びこのようなシステムを実現するためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
に関し、特に音声認識の結果生成されたテキストに属性
を付して出力するものに関する。

【０００２】

【従来の技術】従来より、マイクロフォンから入力され
た音声を音声認識し、テキストに変換して出力する音声
認識システムがある。特開平１１−１１９７９１号公報
は、このようなシステムのうちで、特に入力された音声
中の音韻パターンの変化或いは音声パワーの変化を解析
し、話者の感情までも認識するものを開示している。

【０００３】

【発明が解決しようとする課題】しかしながら、上記の
システムは、話者が１つの単語を発したときにおいて、
その単語を音声認識すると共に、感情レベルを認識する
ことを想定している（上記公報段落００７１〜００７
３、００７７〜００８０参照）。つまり、話者が複数の
単語からなる文章を発し、これを音声認識して連続した
文字列からなるテキストとして出力する場合に、感情レ
ベルをテキストにどのように反映させるかを考慮してい
ない。従って、上記のシステムを文書作成に適用して
も、必ずしも文書作成を容易にすることができなかっ
た。

【０００４】本発明は、音声認識による文書作成を容易
にすることができる音声認識システム、方法及びそのた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体を提供することを目的とする。

【０００５】

【課題を解決するための手段】上記目的を達成するた
め、本発明の第１の観点にかかる音声認識システムは、
外部から入力された音声情報を、文字列に変換する音声
認識手段と、前記音声情報に基づいて前記音声情報が示
す音声の変化を示す変化情報を生成し、生成した変化情
報を前記音声認識手段が変換した文字列中の所定単位毎
に割り当てる変化情報割り当て手段と、前記文字列中の
所定単位のうちの特定のものに対して前記変化情報割り
当て手段が割り当てた変化情報の傾向を学習する学習手
段と、前記変化情報割り当て手段が割り当てた変化情報
と前記学習手段に蓄積された学習結果とに従って、前記
文字列中の所定単位毎に表示属性を付加する属性付加手
段と、を備えることを特徴とする。

【０００６】上記音声認識システムでは、音声認識手段
が変換した文字列中の所定単位毎に、音声の変化に応じ
た表示属性が自動的に付加されることとなる。例えば、
話者が音声に抑揚をつけ、強調している部分では、文字
列中でもその部分を強調するための表示属性を付加する
ことができる。このため、上記音声認識システムによれ
ば、音声認識による文書作成が容易になる。

【０００７】上記音声認識システムにおいて、前記変化
情報割り当て手段は、例えば、前記音声情報が示す音声
の速度、音量及び周波数の少なくとも１つに基づいてス
コアを生成し、生成したスコアを前記文字列中の所定単
位毎に割り当てるものとすることができる。この場合、
前記属性付加手段は、前記変化情報割り当て手段が生成
したスコアに基づいて、前記文字列中の所定単位毎に表
示属性を付加するものとすることができる。

【０００８】さらに、前記属性付加手段は、前記変化情
報割り当て手段が生成したスコアが所定の閾値を越える
場合に、対応する前記文字列中の所定単位に表示属性を
付加するものとしてもよい。

【０００９】上記音声認識システムは、前記音声認識手
段が認識した文字列を構文解析する構文解析手段をさら
に備えていてもよい。この場合、前記属性付加手段は、
さらに前記構文解析手段による構文解析結果に従って、
前記文字列中の所定単位毎に表示属性を付加するものと
することができる。

【００１０】

【００１１】上記のように構文解析手段や学習手段を設
けることによって、文字列中の不自然な位置に表示属性
が付加され、その所定単位が最終的に生成される文字列
中で不自然に強調されてしまうことがない。

【００１２】上記音声認識システムにおいて、前記表示
属性は、例えば、色属性或いはフォント属性とすること
ができる。

【００１３】上記音声認識システムにおいて、表示属性
を付加する所定単位は、例えば、文字、単語、句、節、
文章などとすることができる。

【００１４】上記目的を達成するため、本発明の第２の
観点にかかる音声認識方法は、外部から入力された音声
情報を、文字列に変換する音声認識ステップと、前記音
声情報に基づいて前記音声情報が示す音声の変化を示す
変化情報を生成し、生成した変化情報を前記音声認識ス
テップで変換した文字列中の所定単位毎に割り当てる変
化情報割り当てステップと、前記文字列中の所定単位の
うちの特定のものに対して前記変化情報割り当てステッ
プで割り当てた変化情報の傾向を学習する学習ステップ
と、前記変化情報割り当てステップで割り当てた変化情
報と前記学習ステップでの学習結果とに従って、前記文
字列中の所定単位毎に表示属性を付加する属性付加ステ
ップとを含むことを特徴とする。

【００１５】上記目的を達成するため、本発明の第３の
観点にかかるコンピュータ読み取り可能な記録媒体は、
外部から入力された音声情報を、文字列に変換する音声
認識手段、前記音声情報に基づいて前記音声情報が示す
音声の変化を示す変化情報を生成し、生成した変化情報
を前記音声認識手段が変換した文字列中の所定単位毎に
割り当てる変化情報割り当て手段、前記文字列中の所定
単位のうちの特定のものに対して前記変化情報割り当て
手段が割り当てた変化情報の傾向を学習する学習手段、
及び前記変化情報割り当て手段が割り当てた変化情報と
前記学習手段に蓄積された学習結果とに従って、前記文
字列中の所定単位毎に表示属性を付加する属性付加手段
としてコンピュータ装置を機能させるためのプログラム
を記録したことを特徴とする。

【００１６】

【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態について説明する。

【００１７】図１は、この実施の形態にかかる音声認識
システムの構成を示すブロック図である。図示するよう
に、この音声認識システムは、音声情報入力装置１と、
音声認識装置２と、記憶装置３と、表示データ作成装置
４と、表示装置５とを備えている。

【００１８】音声情報入力装置１は、ユーザの声（音
声）を入力するユーザインターフェース装置であり、ユ
ーザが発した音声をアナログ電気信号に変換するマイク
ロフォン１Ａと、マイクロフォン１Ａから出力されたア
ナログ電気信号を所定のサンプリング間隔でデジタルの
音声情報に変換するインターフェース１Ｂとから構成さ
れている。

【００１９】音声認識装置２は、インターフェース１Ｂ
が変換したデジタルの音声情報から、各文字単位で抑揚
スコア（後述）の付された、１以上の文字からなる文字
列（テキスト）を生成するもので、音声認識部２Ａと、
抑揚スコア割り当て部２Ｂとを有する。

【００２０】音声認識部２Ａは、音声認識技術を適用す
ることにより、インターフェース１Ｂから入力された音
声情報をテキストに変換する。音声認識部２Ａが音声情
報をテキストへ変換するために適用する音声認識技術に
は、従来より音声認識及び仮名漢字変換の分野で知られ
ている種々の技術を用いることができる。

【００２１】抑揚スコア割り当て部２Ｂは、インターフ
ェース１Ｂから入力された音声情報が示す音声のタイム
スタンプ（速度）、ボリューム（音量）及びピッチ（周
波数）の程度を示す抑揚スコアを作成し、これを音声認
識部２Ａが変換したテキスト中の各文字に割り当てる。

【００２２】記憶装置３は、抑揚スコア割り当て部２Ｂ
が各文字に抑揚スコアを割り当てたテキストを一時的に
記憶する。

【００２３】表示データ作成装置４は、記憶装置３に記
憶された抑揚スコアの割り当てられたテキストから表示
装置５に表示する表示データを作成するもので、スコア
標識作成部４Ａと、表示条件設定部４Ｂと、表示条件記
憶部４Ｃと、表示データ作成部４Ｄとを有する。

【００２４】スコア標識作成部４Ａは、記憶装置３に記
憶された情報を読み出し、抑揚スコア割り当て部２Ｂが
テキスト中の各文字に割り当てた抑揚スコアに基づい
て、各文字に色属性及びフォント属性といった表示属性
を割り当てる。

【００２５】表示条件設定部４Ｂは、ユーザの操作によ
り、テキストを表示装置５に表示するための表示条件を
設定する。表示条件記憶部４Ｃは、表示条件設定部４Ｂ
から設定した表示条件を記憶する。この表示条件は、表
示装置５上での行数、行内の文字数、デフォルトの文字
の色やフォントの種類、サイズなどの表示属性を含む。

【００２６】表示データ作成部４Ｄは、表示条件記憶部
４Ｃに記憶した表示条件に従って、スコア標識作成部４
Ａが各文字に表示属性を割り当てたテキストから、表示
装置５に表示するための表示データを作成する。

【００２７】表示装置５は、ＣＲＴ（Cathode Ray Tub
e）、ＬＣＤ（Liquid Crystal Display）等から構成さ
れ、表示データ作成部４Ｄが作成した表示データを表示
して、ユーザに示すユーザインターフェース装置であ
る。

【００２８】なお、この音声認識システムは、例えば、
パーソナルコンピュータ等の汎用コンピュータで実現さ
れる。ここで、音声認識装置２及び表示データ作成装置
４は、プロセッサとそのプログラムを記憶するメモリ、
データを記憶するメモリによって実現されるもので、現
実には同一のコンピュータシステム上で実現されていて
もよい。これらの装置２、４を実現するためのプログラ
ムは、ＣＤ−ＲＯＭなどのコンピュータ読み取り可能な
記録媒体に記録して配布したり、ネットワークを通じて
配信してもよい。また、記憶装置３は、該汎用コンピュ
ータの外部記憶装置などに領域が設けられて実現され
る。

【００２９】以下、この実施の形態にかかる音声認識シ
ステムの動作について、図２のフローチャートを参照し
て説明する。

【００３０】まず、このシステムのユーザは、所定の操
作を行って音声入力の開始を指示する（ステップＳ１
１）。次に、当該ユーザは、マイクロフォン１Ａに向か
って生成したいテキストに対応する音声を発する。この
音声は、マイクロフォン１Ａがアナログ電気信号に変換
し、インターフェース１Ｂがデジタルの音声情報に変換
して、音声認識部２Ａに渡す（ステップＳ１２）。

【００３１】次に、音声認識部２Ａは、音声認識技術の
適用により、インターフェース１Ｂから渡された音声情
報を１以上の文字からなるテキストに変換する。音声認
識部２Ａは、変換したテキストを、音声情報から抽出し
た音声のタイムスタンプ（速度）、ボリューム（音量）
及びピッチ（周波数）を示す情報と共に、抑揚スコア割
り当て部２Ｂに渡す（ステップＳ１３）。

【００３２】次に、抑揚スコア割り当て部２Ｂは、タイ
ムスタンプ、ボリューム及びピッチの変化量を、テキス
ト中の各文字に抑揚スコアとして割り当てる。抑揚スコ
ア割り当て部２Ｂは、各文字に抑揚スコアを割り当てた
テキストを、記憶装置３に一時記憶する（ステップＳ１
４）。なお、この処理の詳細は後述する。

【００３３】次に、スコア標識作成部４Ａは、記憶装置
３に記憶された抑揚スコアに基づき、音声認識部２Ａが
変換したテキスト中の各文字に、色属性及びフォント属
性といった表示属性を割り当てる。スコア標識作成部４
Ａは、表示属性を割り当てたテキストを表示データ作成
部４Ｄに渡す（ステップＳ１５）。なお、この処理の詳
細は後述する。

【００３４】次に、表示データ作成部４Ｄは、表示条件
記憶部４Ｃに記憶された表示条件に従い、スコア標識作
成部４Ａから渡されたテキスト中の各文字に表示属性を
割り当てた表示データを作成する。表示データ作成部４
Ｄは、作成した表示データを表示装置５に渡す（ステッ
プＳ１６）。

【００３５】そして、表示装置５は、表示データ作成部
４Ｄから渡された表示データを表示する（ステップＳ１
７）。そして、このフローチャートの処理を終了する。

【００３６】図３は、図２のステップＳ１４において、
抑揚スコア割り当て部２Ｂが実行する処理を詳細に示す
フローチャートである。抑揚スコア割り当て部２Ｂは、
音声認識部２Ａから渡されたタイムスタンプに従って、
ユーザがマイクロフォン１Ａから入力した音声の速度の
変化量を計算する。計算した音声の速度の変化量は、内
部データＤ１として一時記憶される（ステップＳ２
１）。

【００３７】次に、抑揚スコア割り当て部２Ｂは、音声
認識部２Ａから渡されたボリューム及びピッチに従っ
て、ユーザがマイクロフォン１Ａから入力した音声のデ
ータスカラー量の相対変化量を計算する。ここで計算し
たデータスカラー量も、内部データＤ１として一時記憶
される（ステップＳ２２）。

【００３８】そして、抑揚スコア割り当て部２Ｂは、内
部データＤ１として一時記憶した音声の速度の変化量と
データスカラー量の相対変化量とについて、音声認識部
２Ａから渡されたテキスト中でどの文字に対応するもの
か、文字との組み合わせを判断する。そして、抑揚スコ
ア割り当て部２Ｂは、組み合わされるこれらの変化量を
抑揚スコアとしてテキスト中の各文字に割り当てる（ス
テップＳ２３）。そして、このフローチャートの処理を
終了する。

【００３９】図４は、図２のステップＳ１５において、
スコア標識作成部４Ａが実行する処理を詳細に示すフロ
ーチャートである。この処理は、記憶装置３に記憶され
た抑揚スコアが付されたテキスト中の各文字について、
それぞれ行われる。すなわち、スコア標識作成部４Ａ
は、文字数だけこの処理を繰り返して実行する。

【００４０】まず、スコア標識作成部４Ａは、当該文字
に付された抑揚スコアが予め設定された閾値Ｄ２を下回
っているかどうかを判定する（ステップＳ３１）。閾値
を下回っていると判定した場合は（ステップＳ３１；Ｙ
ＥＳ）、スコア標識作成部４Ａは、当該文字に関するこ
のフローチャートの処理を終了する。

【００４１】一方、閾値を下回っていない、すなわち閾
値以上の抑揚スコアがあったと判定した場合は（ステッ
プＳ３１；ＮＯ）、スコア標識作成部４Ａは、当該文字
に色属性をマッピングするかどうかを対応する抑揚スコ
アに従って判断する（ステップＳ３２）。色属性をマッ
ピングすべきと判断した場合は（ステップＳ３２；ＹＥ
Ｓ）、スコア標識作成部４Ａは、当該文字に抑揚スコア
に応じた色属性をマッピングする（ステップＳ３３）。

【００４２】色属性をマッピングすべきでないと判断し
た場合（ステップＳ３２；ＮＯ）、或いは色属性のマッ
ピングを終了した場合は、スコア標識作成部４Ａは、当
該文字にフォント属性（例えば、フォントサイズ）をマ
ッピングすべきであるかどうかを対応する抑揚スコアに
従って判断する（ステップＳ３４）。

【００４３】フォント属性をマッピングすべきでないと
判断した場合は（ステップＳ３４；ＮＯ）、スコア標識
作成部４Ａは、当該文字に関するこのフローチャートの
処理を終了する。一方、フォント属性をマッピングすべ
きであると判断した場合は（ステップＳ３４；ＹＥ
Ｓ）、スコア標識作成部４Ａは、当該文字に抑揚スコア
に応じたフォント属性をマッピングする（ステップＳ３
５）。そして、当該文字に関するこのフローチャートの
処理を終了する。

【００４４】以下、この実施の形態にかかる音声認識シ
ステムにおいて表示装置５に表示されるテキストを、具
体例に従って説明する。ここでは、説明を簡単にするた
め、スコア標識作成部４Ａは、表示属性としてフォント
属性のみを与えるものとする。また、ユーザは、「今日
はとても楽しかった。」、「おー、やられた。」という
２つの文をマイクロフォン１Ａから入力したものとす
る。

【００４５】第１の文で、ユーザは、「とても」の部分
を強調して喋ったとする。すると、この３つの文字の抑
揚スコアは、他の部分よりも大きくなって閾値を越え
る。このため、スコア標識作成部４Ａは、デフォルトの
フォントサイズよりもフォントサイズを大きくするフォ
ント属性を、この３つの文字に付加する。これにより、
図５に示すように、「とても」の文字が他の部分よりも
大きく強調されて、表示装置５上に表示される。

【００４６】第２の文で、ユーザは、「おー」の部分
を、例えば、だんだん声を小さくして喋ったとする。す
ると、この部分での抑揚スコアは、徐々に小さくなって
いく。ここで、音声認識部２Ａが、この部分を「おおお
おおお」という６文字に変換したとすると、スコア標識
作成部４Ａは、フォントサイズが小さくなっていくよう
に、各文字にフォント属性を付加する。これにより、図
５に示すように、表示装置５上でフォントサイズが小さ
くなっていきながら表示され、音声が小さくなっていく
様子が表される。

【００４７】以上説明したように、この実施の形態にか
かる音声認識システムでは、音声認識部２Ａが変換した
テキスト中の各文字に、抑揚スコア割り当て部２Ｂが抑
揚スコアを割り当て、この抑揚スコアに基づいて、スコ
ア標識作成部４Ａが色属性及びフォント属性といった表
示属性を割り当てている。

【００４８】つまり、ユーザがマイクロフォン１Ａから
音声を入力することによって、表示属性の付されたテキ
ストを自動的に作成することができる。ここで、入力さ
れた音声中で抑揚が強調されている部分に対応する文字
は、文字色を変更したり、フォントサイズを大きくした
りすることによって、テキスト中でも強調されるように
することができる。このため、この実施の形態にかかる
音声認識システムによれば、音声認識による文書作成を
容易に行うことができる。

【００４９】本発明は、上記の実施の形態に限られず、
種々の変形、応用が可能である。以下、本発明に適用可
能な上記の実施の形態の変形態様について説明する。

【００５０】上記の実施の形態では、抑揚スコア割り当
て部２Ｂは、文字を単位として抑揚スコアを割り当て、
スコア標識作成部４Ａは、文字を単位として色情報など
の表示属性を付するものとしていた。しかしながら、単
語を単位として表示属性を付するものとしてもよい。さ
らには、文章中の句、節を単位として、或いは文章を単
位として表示属性を付するものとしてもよい。

【００５１】上記の実施の形態では、抑揚スコア割り当
て部２Ｂは、音声情報から抽出したタイムスタンプ、ボ
リューム及びピッチに基づいて抑揚スコアを作成し、テ
キスト中の各文字に割り当てていた。しかしながら、抑
揚スコア割り当て部２Ｂは、これらのうちの任意の１つ
以上を使用して、抑揚スコアを作成することができる。
また、これら３つ以外の音声の変化に基づいた変化情報
を作成し、この変化情報に従ってテキスト中の各文字に
表示属性を付加するものとしてもよい。

【００５２】上記の実施の形態では、スコア標識作成部
４Ａは、テキスト中の各文字に、表示属性として色属性
及びフォント属性を割り当てていた。しかしながら、こ
れら以外の表示属性、例えば、ボールド、イタリック、
アンダーライン、アッパーライン、網掛け、背景色、上
付、下付、大文字への変換（文字がアルファベットであ
る場合）、文字の反転、回転等の文字飾り属性を各文字
に割り当ててもよい。また、フォント属性としてフォン
トのサイズだけでなく、フォントの種類（ゴシック、明
朝など）を割り当てるものとしてもよい。

【００５３】上記の実施の形態では、スコア標識作成部
４Ａは、抑揚スコア割り当て部２Ｂが各文字に割り当て
た抑揚スコアにのみ基づいて、音声認識部２Ａが変換し
たテキスト中の各文字に色属性或いはフォント属性等の
表示属性を割り当てていた。しかしながら、スコア標識
作成部４Ａは、さらに他の情報に基づいて、各文字に表
示属性を割り当ててもよい。

【００５４】図６は、他の実施の形態にかかる音声認識
システムを示すブロック図である。図６の音声認識シス
テムは、図１の構成に加えて、さらに形態素解析手段６
を有する。形態素解析手段６は、音声認識部２Ａが音声
情報を変換して生成したテキストを形態素解析し、その
結果をスコア標識作成部４Ａに渡す。なお、形態素解析
手段６は、音声認識装置２および／または表示データ作
成装置４と同じコンピュータ装置上で実現されていても
よい。

【００５５】この場合において、スコア標識作成部４Ａ
は、さらに形態素解析手段６の解析結果に基づいて、テ
キスト中の各文字に表示属性を割り当てるものとするこ
とができる。このように音声認識部２Ａが生成したテキ
ストを文法的に解析することにより、例えば、助詞や助
動詞などの通常はあまり強調されない品詞が強調された
不自然なテキストが表示装置５に表示されないようにす
ることができる。

【００５６】また、図７は、さらに他の実施の形態にか
かる音声認識システムを示すブロック図である。図７の
音声認識システムは、図１の構成に加えて、さらに学習
手段７を有する。学習手段７は、指定した特定の単語に
ついての抑揚スコア割り当て部２Ｂによるスコアの割り
当ての傾向を学習し、学習結果をスコア標識作成部４Ａ
に渡す。

【００５７】この場合において、スコア標識作成部４Ａ
は、さらに学習手段７の学習結果に基づいて、テキスト
中の各文字に表示属性を割り当てるものとすることがで
きる。このように抑揚スコア割り当て部２Ｂが割り当て
た抑揚スコアの傾向を学習していくことにより、例え
ば、ユーザの言葉の訛りなどによって必ず強調されてし
まうような単語を、テキスト中では強調しないように
し、不自然なテキストが表示装置５に表示されないよう
にすることができる。

【００５８】さらに、上記した音声認識システムは、ス
コア標識作成部４Ａがテキスト中の各文字に表示属性を
付するかどうかを制御する制御手段をさらに備えるもの
としてもよい。この場合、テキスト中の各文字に表示属
性を付するかどうかの指示を、ユーザが制御手段に与え
ることができるようにし、制御手段がこの指示に基づい
てスコア標識作成部４Ａを制御するものとしてもよい。

【００５９】上記の実施の形態では、音声情報を音声認
識部２Ａに入力するユーザインターフェース装置とし
て、マイクロフォン１Ａ及びインターフェース１Ｂから
なる音声情報入力装置１を適用していたが、本発明はこ
れに限られない。例えば、予めカセットテープなどに記
録された音声を、デジタルの音声情報に変換して音声認
識部２Ａに渡してもよい。また、予め音声をサンプリン
グした音声情報を記録した媒体から音声情報を読み取っ
て、音声認識部２Ａに入力してもよい。

【００６０】上記の実施の形態では、生成されたテキス
トを外部に出力するユーザインターフェース装置とし
て、表示装置５を適用していたが、本発明はこれに限ら
れない。例えば、テキストを紙などの媒体上に印刷して
出力するプリンタであってもよい。また、遠隔地の端末
装置にネットワークを介して送信し、該端末装置から出
力させる通信装置であってもよい。

【００６１】

【発明の効果】以上説明したように、本発明によれば、
音声情報から変換された文字列に、音声の変化に応じた
表示属性が自動的に付加されることとなるので、音声認
識による文書の作成が容易になる。

【図面の簡単な説明】

【図１】本発明の実施の形態にかかる音声認識システム
の構成を示すブロック図である。

【図２】図１の音声認識システムが実行する処理を示す
フローチャートである。

【図３】抑揚スコア割り当て部が実行する処理を詳細に
示すフローチャートである。

【図４】スコア標識作成部が実行する処理を詳細に示す
フローチャートである。

【図５】図１の音声認識システムにおいて、表示装置に
表示されるテキストの例を示す図である。

【図６】本発明の他の実施の形態にかかる音声認識シス
テムの構成を示すブロック図である。

【図７】本発明の他の実施の形態にかかる音声認識シス
テムの構成を示すブロック図である。

【符号の説明】

１音声情報入力装置１Ａマイクロフォン１Ｂインターフェース２音声認識装置２Ａ音声認識部２Ｂ抑揚スコア割り当て部３記憶装置４表示データ作成装置４Ａスコア標識作成部４Ｂ表示条件設定部４Ｃ表示条件記憶部４Ｄ表示データ作成部５表示装置６形態素解析手段７学習手段

Claims

(57)【特許請求の範囲】

【請求項１】外部から入力された音声情報を、文字列に
変換する音声認識手段と、前記音声情報に基づいて前記音声情報が示す音声の変化
を示す変化情報を生成し、生成した変化情報を前記音声
認識手段が変換した文字列中の所定単位毎に割り当てる
変化情報割り当て手段と、前記文字列中の所定単位のうちの特定のものに対して前
記変化情報割り当て手段が割り当てた変化情報の傾向を
学習する学習手段と、前記変化情報割り当て手段が割り当てた変化情報と前記
学習手段に蓄積された学習結果とに従って、前記文字列
中の所定単位毎に表示属性を付加する属性付加手段と、を備えることを特徴とする音声認識システム。
【請求項２】前記変化情報割り当て手段は、前記音声情
報が示す音声の速度、音量及び周波数の少なくとも１つ
に基づいてスコアを生成し、生成したスコアを前記文字
列中の所定単位毎に割り当て、前記属性付加手段は、前記変化情報割り当て手段が生成
したスコアに基づいて、前記文字列中の所定単位毎に表
示属性を付加することを特徴とする請求項１に記載の音
声認識システム。
【請求項３】前記属性付加手段は、前記変化情報割り当
て手段が生成したスコアが所定の閾値を越える場合に、
対応する前記文字列中の所定単位に表示属性を付加する
ことを特徴とする請求項２に記載の音声認識システム。
【請求項４】前記音声認識手段が認識した文字列を構文
解析する構文解析手段をさらに備え、前記属性付加手段は、さらに前記構文解析手段による構
文解析結果に従って、前記文字列中の所定単位毎に表示
属性を付加することを特徴とする請求項１乃至３のいず
れか１項に記載の音声認識システム。
【請求項５】前記表示属性は、色属性であることを特徴
とする請求項１乃至４のいずれか１項に記載の音声認識
システム。
【請求項６】前記表示属性は、フォント属性であること
を特徴とする請求項１乃至５のいずれか１項に記載の音
声認識システム。
【請求項７】外部から入力された音声情報を、文字列に
変換する音声認識ステップと、前記音声情報に基づいて前記音声情報が示す音声の変化
を示す変化情報を生成し、生成した変化情報を前記音声
認識ステップで変換した文字列中の所定単位毎に割り当
てる変化情報割り当てステップと、前記文字列中の所定単位のうちの特定のものに対して前
記変化情報割り当てステップで割り当てた変化情報の傾
向を学習する学習ステップと、前記変化情報割り当てステップで割り当てた変化情報と
前記学習ステップでの学習結果とに従って、前記文字列
中の所定単位毎に表示属性を付加する属性付加ステップ
とを含むことを特徴とする音声認識方法。
【請求項８】外部から入力された音声情報を、文字列に
変換する音声認識手段、前記音声情報に基づいて前記音声情報が示す音声の変化
を示す変化情報を生成し、生成した変化情報を前記音声
認識手段が変換した文字列中の所定単位毎に割り当てる
変化情報割り当て手段、前記文字列中の所定単位のうちの特定のものに対して前
記変化情報割り当て手段が割り当てた変化情報の傾向を
学習する学習手段、及び前記変化情報割り当て手段が割り当てた変化情報と前記
学習手段に蓄積された学習結果とに従って、前記文字列
中の所定単位毎に表示属性を付加する属性付加手段、としてコンピュータ装置を機能させるためのプログラム
を記録したことを特徴とするコンピュータ読み取り可能
な記録媒体。