JP3438869B2 - 音声認識システム、方法及び記録媒体 - Google Patents

音声認識システム、方法及び記録媒体

Info

Publication number
JP3438869B2
JP3438869B2 JP31693899A JP31693899A JP3438869B2 JP 3438869 B2 JP3438869 B2 JP 3438869B2 JP 31693899 A JP31693899 A JP 31693899A JP 31693899 A JP31693899 A JP 31693899A JP 3438869 B2 JP3438869 B2 JP 3438869B2
Authority
JP
Japan
Prior art keywords
voice
unit
change information
character string
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31693899A
Other languages
English (en)
Other versions
JP2001134290A (ja
Inventor
広樹 谷岡
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP31693899A priority Critical patent/JP3438869B2/ja
Publication of JP2001134290A publication Critical patent/JP2001134290A/ja
Application granted granted Critical
Publication of JP3438869B2 publication Critical patent/JP3438869B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識システ
ム、方法及びこのようなシステムを実現するためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
に関し、特に音声認識の結果生成されたテキストに属性
を付して出力するものに関する。
【0002】
【従来の技術】従来より、マイクロフォンから入力され
た音声を音声認識し、テキストに変換して出力する音声
認識システムがある。特開平11−119791号公報
は、このようなシステムのうちで、特に入力された音声
中の音韻パターンの変化或いは音声パワーの変化を解析
し、話者の感情までも認識するものを開示している。
【0003】
【発明が解決しようとする課題】しかしながら、上記の
システムは、話者が1つの単語を発したときにおいて、
その単語を音声認識すると共に、感情レベルを認識する
ことを想定している(上記公報段落0071〜007
3、0077〜0080参照)。つまり、話者が複数の
単語からなる文章を発し、これを音声認識して連続した
文字列からなるテキストとして出力する場合に、感情レ
ベルをテキストにどのように反映させるかを考慮してい
ない。従って、上記のシステムを文書作成に適用して
も、必ずしも文書作成を容易にすることができなかっ
た。
【0004】本発明は、音声認識による文書作成を容易
にすることができる音声認識システム、方法及びそのた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の第1の観点にかかる音声認識システムは、
外部から入力された音声情報を、文字列に変換する音声
認識手段と、前記音声情報に基づいて前記音声情報が示
す音声の変化を示す変化情報を生成し、生成した変化情
報を前記音声認識手段が変換した文字列中の所定単位毎
に割り当てる変化情報割り当て手段と、前記文字列中の
所定単位のうちの特定のものに対して前記変化情報割り
当て手段が割り当てた変化情報の傾向を学習する学習手
段と、前記変化情報割り当て手段が割り当てた変化情報
と前記学習手段に蓄積された学習結果とに従って、前記
文字列中の所定単位毎に表示属性を付加する属性付加手
段とを備えることを特徴とする。
【0006】上記音声認識システムでは、音声認識手段
が変換した文字列中の所定単位毎に、音声の変化に応じ
た表示属性が自動的に付加されることとなる。例えば、
話者が音声に抑揚をつけ、強調している部分では、文字
列中でもその部分を強調するための表示属性を付加する
ことができる。このため、上記音声認識システムによれ
ば、音声認識による文書作成が容易になる。
【0007】上記音声認識システムにおいて、前記変化
情報割り当て手段は、例えば、前記音声情報が示す音声
の速度、音量及び周波数の少なくとも1つに基づいてス
コアを生成し、生成したスコアを前記文字列中の所定単
位毎に割り当てるものとすることができる。この場合、
前記属性付加手段は、前記変化情報割り当て手段が生成
したスコアに基づいて、前記文字列中の所定単位毎に表
示属性を付加するものとすることができる。
【0008】さらに、前記属性付加手段は、前記変化情
報割り当て手段が生成したスコアが所定の閾値を越える
場合に、対応する前記文字列中の所定単位に表示属性を
付加するものとしてもよい。
【0009】上記音声認識システムは、前記音声認識手
段が認識した文字列を構文解析する構文解析手段をさら
に備えていてもよい。この場合、前記属性付加手段は、
さらに前記構文解析手段による構文解析結果に従って、
前記文字列中の所定単位毎に表示属性を付加するものと
することができる。
【0010】
【0011】上記のように構文解析手段や学習手段を設
けることによって、文字列中の不自然な位置に表示属性
が付加され、その所定単位が最終的に生成される文字列
中で不自然に強調されてしまうことがない。
【0012】上記音声認識システムにおいて、前記表示
属性は、例えば、色属性或いはフォント属性とすること
ができる。
【0013】上記音声認識システムにおいて、表示属性
を付加する所定単位は、例えば、文字、単語、句、節、
文章などとすることができる。
【0014】上記目的を達成するため、本発明の第
観点にかかる音声認識方法は、外部から入力された音声
情報を、文字列に変換する音声認識ステップと、前記音
声情報に基づいて前記音声情報が示す音声の変化を示す
変化情報を生成し、生成した変化情報を前記音声認識ス
テップで変換した文字列中の所定単位毎に割り当てる変
化情報割り当てステップと、前記文字列中の所定単位の
うちの特定のものに対して前記変化情報割り当てステッ
プで割り当てた変化情報の傾向を学習する学習ステップ
と、前記変化情報割り当てステップで割り当てた変化情
報と前記学習ステップでの学習結果とに従って、前記文
字列中の所定単位毎に表示属性を付加する属性付加ステ
ップとを含むことを特徴とする。
【0015】上記目的を達成するため、本発明の第
観点にかかるコンピュータ読み取り可能な記録媒体は、
外部から入力された音声情報を、文字列に変換する音声
認識手段、前記音声情報に基づいて前記音声情報が示す
音声の変化を示す変化情報を生成し、生成した変化情報
を前記音声認識手段が変換した文字列中の所定単位毎に
割り当てる変化情報割り当て手段、前記文字列中の所定
単位のうちの特定のものに対して前記変化情報割り当て
手段が割り当てた変化情報の傾向を学習する学習手段、
及び前記変化情報割り当て手段が割り当てた変化情報と
前記学習手段に蓄積された学習結果とに従って、前記文
字列中の所定単位毎に表示属性を付加する属性付加手段
としてコンピュータ装置を機能させるためのプログラム
を記録したことを特徴とする。
【0016】
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態について説明する。
【0017】図1は、この実施の形態にかかる音声認識
システムの構成を示すブロック図である。図示するよう
に、この音声認識システムは、音声情報入力装置1と、
音声認識装置2と、記憶装置3と、表示データ作成装置
4と、表示装置5とを備えている。
【0018】音声情報入力装置1は、ユーザの声(音
声)を力するユーザインターフェース装置であり、ユ
ーザが発した音声をアナログ電気信号に変換するマイク
ロフォン1Aと、マイクロフォン1Aから出力されたア
ナログ電気信号を所定のサンプリング間隔でデジタルの
音声情報に変換するインターフェース1Bとから構成さ
れている。
【0019】音声認識装置2は、インターフェース1B
が変換したデジタルの音声情報から、各文字単位で抑揚
スコア(後述)の付された、1以上の文字からなる文字
列(テキスト)を生成するもので、音声認識部2Aと、
抑揚スコア割り当て部2Bとを有する。
【0020】音声認識部2Aは、音声認識技術を適用す
ることにより、インターフェース1Bから入力された音
声情報をテキストに変換する。音声認識部2Aが音声情
報をテキストへ変換するために適用する音声認識技術に
は、従来より音声認識及び仮名漢字変換の分野で知られ
ている種々の技術を用いることができる。
【0021】抑揚スコア割り当て部2Bは、インターフ
ェース1Bから入力された音声情報が示す音声のタイム
スタンプ(速度)、ボリューム(音量)及びピッチ(周
波数)の程度を示す抑揚スコアを作成し、これを音声認
識部2Aが変換したテキスト中の各文字に割り当てる。
【0022】記憶装置3は、抑揚スコア割り当て部2B
が各文字に抑揚スコアを割り当てたテキストを一時的に
記憶する。
【0023】表示データ作成装置4は、記憶装置3に記
憶された抑揚スコアの割り当てられたテキストから表示
装置5に表示する表示データを作成するもので、スコア
標識作成部4Aと、表示条件設定部4Bと、表示条件記
憶部4Cと、表示データ作成部4Dとを有する。
【0024】スコア標識作成部4Aは、記憶装置3に記
憶された情報を読み出し、抑揚スコア割り当て部2Bが
テキスト中の各文字に割り当てた抑揚スコアに基づい
て、各文字に色属性及びフォント属性といった表示属性
を割り当てる。
【0025】表示条件設定部4Bは、ユーザの操作によ
り、テキストを表示装置5に表示するための表示条件を
設定する。表示条件記憶部4Cは、表示条件設定部4B
から設定した表示条件を記憶する。この表示条件は、表
示装置5上での行数、行内の文字数、デフォルトの文字
の色やフォントの種類、サイズなどの表示属性を含む。
【0026】表示データ作成部4Dは、表示条件記憶部
4Cに記憶した表示条件に従って、スコア標識作成部4
Aが各文字に表示属性を割り当てたテキストから、表示
装置5に表示するための表示データを作成する。
【0027】表示装置5は、CRT(Cathode Ray Tub
e)、LCD(Liquid Crystal Display)等から構成さ
れ、表示データ作成部4Dが作成した表示データを表示
して、ユーザに示すユーザインターフェース装置であ
る。
【0028】なお、この音声認識システムは、例えば、
パーソナルコンピュータ等の汎用コンピュータで実現さ
れる。ここで、音声認識装置2及び表示データ作成装置
4は、プロセッサとそのプログラムを記憶するメモリ、
データを記憶するメモリによって実現されるもので、現
実には同一のコンピュータシステム上で実現されていて
もよい。これらの装置2、4を実現するためのプログラ
ムは、CD−ROMなどのコンピュータ読み取り可能な
記録媒体に記録して配布したり、ネットワークを通じて
配信してもよい。また、記憶装置3は、該汎用コンピュ
ータの外部記憶装置などに領域が設けられて実現され
る。
【0029】以下、この実施の形態にかかる音声認識シ
ステムの動作について、図2のフローチャートを参照し
て説明する。
【0030】まず、このシステムのユーザは、所定の操
作を行って音声入力の開始を指示する(ステップS1
1)。次に、当該ユーザは、マイクロフォン1Aに向か
って生成したいテキストに対応する音声を発する。この
音声は、マイクロフォン1Aがアナログ電気信号に変換
し、インターフェース1Bがデジタルの音声情報に変換
して、音声認識部2Aに渡す(ステップS12)。
【0031】次に、音声認識部2Aは、音声認識技術の
適用により、インターフェース1Bから渡された音声情
報を1以上の文字からなるテキストに変換する。音声認
識部2Aは、変換したテキストを、音声情報から抽出し
た音声のタイムスタンプ(速度)、ボリューム(音量)
及びピッチ(周波数)を示す情報と共に、抑揚スコア割
り当て部2Bに渡す(ステップS13)。
【0032】次に、抑揚スコア割り当て部2Bは、タイ
ムスタンプ、ボリューム及びピッチの変化量を、テキス
ト中の各文字に抑揚スコアとして割り当てる。抑揚スコ
ア割り当て部2Bは、各文字に抑揚スコアを割り当てた
テキストを、記憶装置3に一時記憶する(ステップS1
4)。なお、この処理の詳細は後述する。
【0033】次に、スコア標識作成部4Aは、記憶装置
3に記憶された抑揚スコアに基づき、音声認識部2Aが
変換したテキスト中の各文字に、色属性及びフォント属
性といった表示属性を割り当てる。スコア標識作成部4
Aは、表示属性を割り当てたテキストを表示データ作成
部4Dに渡す(ステップS15)。なお、この処理の詳
細は後述する。
【0034】次に、表示データ作成部4Dは、表示条件
記憶部4Cに記憶された表示条件に従い、スコア標識作
成部4Aから渡されたテキスト中の各文字に表示属性を
割り当てた表示データを作成する。表示データ作成部4
Dは、作成した表示データを表示装置5に渡す(ステッ
プS16)。
【0035】そして、表示装置5は、表示データ作成部
4Dから渡された表示データを表示する(ステップS1
7)。そして、このフローチャートの処理を終了する。
【0036】図3は、図2のステップS14において、
抑揚スコア割り当て部2Bが実行する処理を詳細に示す
フローチャートである。抑揚スコア割り当て部2Bは、
音声認識部2Aから渡されたタイムスタンプに従って、
ユーザがマイクロフォン1Aから入力した音声の速度の
変化量を計算する。計算した音声の速度の変化量は、内
部データD1として一時記憶される(ステップS2
1)。
【0037】次に、抑揚スコア割り当て部2Bは、音声
認識部2Aから渡されたボリューム及びピッチに従っ
て、ユーザがマイクロフォン1Aから入力した音声のデ
ータスカラー量の相対変化量を計算する。ここで計算し
たデータスカラー量も、内部データD1として一時記憶
される(ステップS22)。
【0038】そして、抑揚スコア割り当て部2Bは、内
部データD1として一時記憶した音声の速度の変化量と
データスカラー量の相対変化量とについて、音声認識部
2Aから渡されたテキスト中でどの文字に対応するもの
か、文字との組み合わせを判断する。そして、抑揚スコ
ア割り当て部2Bは、組み合わされるこれらの変化量を
抑揚スコアとしてテキスト中の各文字に割り当てる(ス
テップS23)。そして、このフローチャートの処理を
終了する。
【0039】図4は、図2のステップS15において、
スコア標識作成部4Aが実行する処理を詳細に示すフロ
ーチャートである。この処理は、記憶装置3に記憶され
た抑揚スコアが付されたテキスト中の各文字について、
それぞれ行われる。すなわち、スコア標識作成部4A
は、文字数だけこの処理を繰り返して実行する。
【0040】まず、スコア標識作成部4Aは、当該文字
に付された抑揚スコアが予め設定された閾値D2を下回
っているかどうかを判定する(ステップS31)。閾値
を下回っていると判定した場合は(ステップS31;Y
ES)、スコア標識作成部4Aは、当該文字に関するこ
のフローチャートの処理を終了する。
【0041】一方、閾値を下回っていない、すなわち閾
値以上の抑揚スコアがあったと判定した場合は(ステッ
プS31;NO)、スコア標識作成部4Aは、当該文字
に色属性をマッピングするかどうかを対応する抑揚スコ
アに従って判断する(ステップS32)。色属性をマッ
ピングすべきと判断した場合は(ステップS32;YE
S)、スコア標識作成部4Aは、当該文字に抑揚スコア
に応じた色属性をマッピングする(ステップS33)。
【0042】色属性をマッピングすべきでないと判断し
た場合(ステップS32;NO)、或いは色属性のマッ
ピングを終了した場合は、スコア標識作成部4Aは、当
該文字にフォント属性(例えば、フォントサイズ)をマ
ッピングすべきであるかどうかを対応する抑揚スコアに
従って判断する(ステップS34)。
【0043】フォント属性をマッピングすべきでないと
判断した場合は(ステップS34;NO)、スコア標識
作成部4Aは、当該文字に関するこのフローチャートの
処理を終了する。一方、フォント属性をマッピングすべ
きであると判断した場合は(ステップS34;YE
S)、スコア標識作成部4Aは、当該文字に抑揚スコア
に応じたフォント属性をマッピングする(ステップS3
5)。そして、当該文字に関するこのフローチャートの
処理を終了する。
【0044】以下、この実施の形態にかかる音声認識シ
ステムにおいて表示装置5に表示されるテキストを、具
体例に従って説明する。ここでは、説明を簡単にするた
め、スコア標識作成部4Aは、表示属性としてフォント
属性のみを与えるものとする。また、ユーザは、「今日
はとても楽しかった。」、「おー、やられた。」という
2つの文をマイクロフォン1Aから入力したものとす
る。
【0045】第1の文で、ユーザは、「とても」の部分
を強調して喋ったとする。すると、この3つの文字の抑
揚スコアは、他の部分よりも大きくなって閾値を越え
る。このため、スコア標識作成部4Aは、デフォルトの
フォントサイズよりもフォントサイズを大きくするフォ
ント属性を、この3つの文字に付加する。これにより、
図5に示すように、「とても」の文字が他の部分よりも
大きく強調されて、表示装置5上に表示される。
【0046】第2の文で、ユーザは、「おー」の部分
を、例えば、だんだん声を小さくして喋ったとする。す
ると、この部分での抑揚スコアは、徐々に小さくなって
いく。ここで、音声認識部2Aが、この部分を「おおお
おおお」という6文字に変換したとすると、スコア標識
作成部4Aは、フォントサイズが小さくなっていくよう
に、各文字にフォント属性を付加する。これにより、図
5に示すように、表示装置5上でフォントサイズが小さ
くなっていきながら表示され、音声が小さくなっていく
様子が表される。
【0047】以上説明したように、この実施の形態にか
かる音声認識システムでは、音声認識部2Aが変換した
テキスト中の各文字に、抑揚スコア割り当て部2Bが抑
揚スコアを割り当て、この抑揚スコアに基づいて、スコ
ア標識作成部4Aが色属性及びフォント属性といった表
示属性を割り当てている。
【0048】つまり、ユーザがマイクロフォン1Aから
音声を入力することによって、表示属性の付されたテキ
ストを自動的に作成することができる。ここで、入力さ
れた音声中で抑揚が強調されている部分に対応する文字
は、文字色を変更したり、フォントサイズを大きくした
りすることによって、テキスト中でも強調されるように
することができる。このため、この実施の形態にかかる
音声認識システムによれば、音声認識による文書作成を
容易に行うことができる。
【0049】本発明は、上記の実施の形態に限られず、
種々の変形、応用が可能である。以下、本発明に適用可
能な上記の実施の形態の変形態様について説明する。
【0050】上記の実施の形態では、抑揚スコア割り当
て部2Bは、文字を単位として抑揚スコアを割り当て、
スコア標識作成部4Aは、文字を単位として色情報など
の表示属性を付するものとしていた。しかしながら、単
語を単位として表示属性を付するものとしてもよい。さ
らには、文章中の句、節を単位として、或いは文章を単
位として表示属性を付するものとしてもよい。
【0051】上記の実施の形態では、抑揚スコア割り当
て部2Bは、音声情報から抽出したタイムスタンプ、ボ
リューム及びピッチに基づいて抑揚スコアを作成し、テ
キスト中の各文字に割り当てていた。しかしながら、抑
揚スコア割り当て部2Bは、これらのうちの任意の1つ
以上を使用して、抑揚スコアを作成することができる。
また、これら3つ以外の音声の変化に基づいた変化情報
を作成し、この変化情報に従ってテキスト中の各文字に
表示属性を付加するものとしてもよい。
【0052】上記の実施の形態では、スコア標識作成部
4Aは、テキスト中の各文字に、表示属性として色属性
及びフォント属性を割り当てていた。しかしながら、こ
れら以外の表示属性、例えば、ボールド、イタリック、
アンダーライン、アッパーライン、網掛け、背景色、上
付、下付、大文字への変換(文字がアルファベットであ
る場合)、文字の反転、回転等の文字飾り属性を各文字
に割り当ててもよい。また、フォント属性としてフォン
トのサイズだけでなく、フォントの種類(ゴシック、明
朝など)を割り当てるものとしてもよい。
【0053】上記の実施の形態では、スコア標識作成部
4Aは、抑揚スコア割り当て部2Bが各文字に割り当て
た抑揚スコアにのみ基づいて、音声認識部2Aが変換し
たテキスト中の各文字に色属性或いはフォント属性等の
表示属性を割り当てていた。しかしながら、スコア標識
作成部4Aは、さらに他の情報に基づいて、各文字に表
示属性を割り当ててもよい。
【0054】図6は、他の実施の形態にかかる音声認識
システムを示すブロック図である。図6の音声認識シス
テムは、図1の構成に加えて、さらに形態素解析手段6
を有する。形態素解析手段6は、音声認識部2Aが音声
情報を変換して生成したテキストを形態素解析し、その
結果をスコア標識作成部4Aに渡す。なお、形態素解析
手段6は、音声認識装置2および/または表示データ作
成装置4と同じコンピュータ装置上で実現されていても
よい。
【0055】この場合において、スコア標識作成部4A
は、さらに形態素解析手段6の解析結果に基づいて、テ
キスト中の各文字に表示属性を割り当てるものとするこ
とができる。このように音声認識部2Aが生成したテキ
ストを文法的に解析することにより、例えば、助詞や助
動詞などの通常はあまり強調されない品詞が強調された
不自然なテキストが表示装置5に表示されないようにす
ることができる。
【0056】また、図7は、さらに他の実施の形態にか
かる音声認識システムを示すブロック図である。図7の
音声認識システムは、図1の構成に加えて、さらに学習
手段7を有する。学習手段7は、指定した特定の単語に
ついての抑揚スコア割り当て部2Bによるスコアの割り
当ての傾向を学習し、学習結果をスコア標識作成部4A
に渡す。
【0057】この場合において、スコア標識作成部4A
は、さらに学習手段7の学習結果に基づいて、テキスト
中の各文字に表示属性を割り当てるものとすることがで
きる。このように抑揚スコア割り当て部2Bが割り当て
た抑揚スコアの傾向を学習していくことにより、例え
ば、ユーザの言葉の訛りなどによって必ず強調されてし
まうような単語を、テキスト中では強調しないように
し、不自然なテキストが表示装置5に表示されないよう
にすることができる。
【0058】さらに、上記した音声認識システムは、ス
コア標識作成部4Aがテキスト中の各文字に表示属性を
付するかどうかを制御する制御手段をさらに備えるもの
としてもよい。この場合、テキスト中の各文字に表示属
性を付するかどうかの指示を、ユーザが制御手段に与え
ることができるようにし、制御手段がこの指示に基づい
てスコア標識作成部4Aを制御するものとしてもよい。
【0059】上記の実施の形態では、音声情報を音声認
識部2Aに入力するユーザインターフェース装置とし
て、マイクロフォン1A及びインターフェース1Bから
なる音声情報入力装置1を適用していたが、本発明はこ
れに限られない。例えば、予めカセットテープなどに記
録された音声を、デジタルの音声情報に変換して音声認
識部2Aに渡してもよい。また、予め音声をサンプリン
グした音声情報を記録した媒体から音声情報を読み取っ
て、音声認識部2Aに入力してもよい。
【0060】上記の実施の形態では、生成されたテキス
トを外部に出力するユーザインターフェース装置とし
て、表示装置5を適用していたが、本発明はこれに限ら
れない。例えば、テキストを紙などの媒体上に印刷して
出力するプリンタであってもよい。また、遠隔地の端末
装置にネットワークを介して送信し、該端末装置から出
力させる通信装置であってもよい。
【0061】
【発明の効果】以上説明したように、本発明によれば、
音声情報から変換された文字列に、音声の変化に応じた
表示属性が自動的に付加されることとなるので、音声認
識による文書の作成が容易になる。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかる音声認識システム
の構成を示すブロック図である。
【図2】図1の音声認識システムが実行する処理を示す
フローチャートである。
【図3】抑揚スコア割り当て部が実行する処理を詳細に
示すフローチャートである。
【図4】スコア標識作成部が実行する処理を詳細に示す
フローチャートである。
【図5】図1の音声認識システムにおいて、表示装置に
表示されるテキストの例を示す図である。
【図6】本発明の他の実施の形態にかかる音声認識シス
テムの構成を示すブロック図である。
【図7】本発明の他の実施の形態にかかる音声認識シス
テムの構成を示すブロック図である。
【符号の説明】
1 音声情報入力装置 1A マイクロフォン 1B インターフェース 2 音声認識装置 2A 音声認識部 2B 抑揚スコア割り当て部 3 記憶装置 4 表示データ作成装置 4A スコア標識作成部 4B 表示条件設定部 4C 表示条件記憶部 4D 表示データ作成部 5 表示装置 6 形態素解析手段 7 学習手段

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】外部から入力された音声情報を、文字列に
    変換する音声認識手段と、 前記音声情報に基づいて前記音声情報が示す音声の変化
    を示す変化情報を生成し、生成した変化情報を前記音声
    認識手段が変換した文字列中の所定単位毎に割り当てる
    変化情報割り当て手段と、 前記文字列中の所定単位のうちの特定のものに対して前
    記変化情報割り当て手段が割り当てた変化情報の傾向を
    学習する学習手段と、 前記変化情報割り当て手段が割り当てた変化情報と前記
    学習手段に蓄積された学習結果とに従って、前記文字列
    中の所定単位毎に表示属性を付加する属性付加手段と、 を備えることを特徴とする音声認識システム。
  2. 【請求項2】前記変化情報割り当て手段は、前記音声情
    報が示す音声の速度、音量及び周波数の少なくとも1つ
    に基づいてスコアを生成し、生成したスコアを前記文字
    列中の所定単位毎に割り当て、 前記属性付加手段は、前記変化情報割り当て手段が生成
    したスコアに基づいて、前記文字列中の所定単位毎に表
    示属性を付加することを特徴とする請求項1に記載の音
    声認識システム。
  3. 【請求項3】前記属性付加手段は、前記変化情報割り当
    て手段が生成したスコアが所定の閾値を越える場合に、
    対応する前記文字列中の所定単位に表示属性を付加する
    ことを特徴とする請求項2に記載の音声認識システム。
  4. 【請求項4】前記音声認識手段が認識した文字列を構文
    解析する構文解析手段をさらに備え、 前記属性付加手段は、さらに前記構文解析手段による構
    文解析結果に従って、前記文字列中の所定単位毎に表示
    属性を付加することを特徴とする請求項1乃至3のいず
    れか1項に記載の音声認識システム。
  5. 【請求項5】前記表示属性は、色属性であることを特徴
    とする請求項1乃至4のいずれか1項に記載の音声認識
    システム。
  6. 【請求項6】前記表示属性は、フォント属性であること
    を特徴とする請求項1乃至5のいずれか1項に記載の音
    声認識システム。
  7. 【請求項7】外部から入力された音声情報を、文字列に
    変換する音声認識ステップと、 前記音声情報に基づいて前記音声情報が示す音声の変化
    を示す変化情報を生成し、生成した変化情報を前記音声
    認識ステップで変換した文字列中の所定単位毎に割り当
    てる変化情報割り当てステップと、 前記文字列中の所定単位のうちの特定のものに対して前
    記変化情報割り当てステップで割り当てた変化情報の傾
    向を学習する学習ステップと、 前記変化情報割り当てステップで割り当てた変化情報と
    前記学習ステップでの学習結果とに従って、前記文字列
    中の所定単位毎に表示属性を付加する属性付加ステップ
    とを含むことを特徴とする音声認識方法。
  8. 【請求項8】外部から入力された音声情報を、文字列に
    変換する音声認識手段、 前記音声情報に基づいて前記音声情報が示す音声の変化
    を示す変化情報を生成し、生成した変化情報を前記音声
    認識手段が変換した文字列中の所定単位毎に割り当てる
    変化情報割り当て手段、 前記文字列中の所定単位のうちの特定のものに対して前
    記変化情報割り当て手段が割り当てた変化情報の傾向を
    学習する学習手段、及び 前記変化情報割り当て手段が割り当てた変化情報と前記
    学習手段に蓄積された学習結果とに従って、前記文字列
    中の所定単位毎に表示属性を付加する属性付加手段、 としてコンピュータ装置を機能させるためのプログラム
    を記録したことを特徴とするコンピュータ読み取り可能
    な記録媒体。
JP31693899A 1999-11-08 1999-11-08 音声認識システム、方法及び記録媒体 Expired - Fee Related JP3438869B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31693899A JP3438869B2 (ja) 1999-11-08 1999-11-08 音声認識システム、方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31693899A JP3438869B2 (ja) 1999-11-08 1999-11-08 音声認識システム、方法及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001134290A JP2001134290A (ja) 2001-05-18
JP3438869B2 true JP3438869B2 (ja) 2003-08-18

Family

ID=18082623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31693899A Expired - Fee Related JP3438869B2 (ja) 1999-11-08 1999-11-08 音声認識システム、方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP3438869B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60204827T2 (de) 2001-08-08 2006-04-27 Nippon Telegraph And Telephone Corp. Anhebungsdetektion zur automatischen Sprachzusammenfassung
US7853863B2 (en) 2001-12-12 2010-12-14 Sony Corporation Method for expressing emotion in a text message
JP4232453B2 (ja) * 2002-12-18 2009-03-04 株式会社デンソー 通話音声のテキスト変換システム
JP2015212732A (ja) * 2014-05-01 2015-11-26 日本放送協会 音喩認識装置、及びプログラム
KR101863776B1 (ko) * 2017-05-29 2018-06-01 비비트리 주식회사 인식된 음성에 대응하는 텍스트의 표현 방법, 표현 장치 및 표현 시스템

Also Published As

Publication number Publication date
JP2001134290A (ja) 2001-05-18

Similar Documents

Publication Publication Date Title
US6226614B1 (en) Method and apparatus for editing/creating synthetic speech message and recording medium with the method recorded thereon
EP1096472B1 (en) Audio playback of a multi-source written document
JP3616250B2 (ja) 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体
US8170876B2 (en) Speech processing apparatus and program
JP2008276543A (ja) 対話処理装置、応答文生成方法、及び応答文生成処理プログラム
JP3438869B2 (ja) 音声認識システム、方法及び記録媒体
US20170116978A1 (en) Voice Synthesizing Apparatus, Voice Synthesizing Method, and Storage Medium Therefor
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
US20200387806A1 (en) Idea generation support device, idea generation support system, and recording medium
EP0982684A1 (en) Moving picture generating device and image control network learning device
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP2001134289A (ja) 音声認識システム、方法及び記録媒体
JPH08272388A (ja) 音声合成装置及びその方法
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP2002123281A (ja) 音声合成装置
JPH0916190A (ja) 文章読上装置
JPH08161335A (ja) 機械翻訳装置
JPH04199421A (ja) 文書読上げ装置
JP2002149179A (ja) メロディ生成装置及びメロディ生成方法並びにメロディ生成プログラムを記録した記録媒体
JPH11272673A (ja) 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体
JP2002073070A (ja) 音声処理方法、音声処理装置及び記憶媒体並びに自然言語処理方法
JP2020181141A (ja) 歌詞入力方法およびプログラム
JPH04199420A (ja) 文書読上げ装置
CN113421543A (zh) 一种数据标注方法、装置、设备及可读存储介质
JPH0736906A (ja) テキスト音声変換装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030212

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030520

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees