JP2001147919A - 音声処理装置及び方法並びにこれに利用される記憶媒体 - Google Patents

音声処理装置及び方法並びにこれに利用される記憶媒体

Info

Publication number
JP2001147919A
JP2001147919A JP33332099A JP33332099A JP2001147919A JP 2001147919 A JP2001147919 A JP 2001147919A JP 33332099 A JP33332099 A JP 33332099A JP 33332099 A JP33332099 A JP 33332099A JP 2001147919 A JP2001147919 A JP 2001147919A
Authority
JP
Japan
Prior art keywords
voice
input
character pattern
attribute information
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP33332099A
Other languages
English (en)
Inventor
Daiko Akashi
大甲 明石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP33332099A priority Critical patent/JP2001147919A/ja
Publication of JP2001147919A publication Critical patent/JP2001147919A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 話者が意図的に強調して入力した音声の部分
を視覚的に容易に読み取れる文書に変換して出力する。 【解決手段】 音声を入力する音声入力部と、入力され
た音声を認識して文字コード列に変換する音声認識部
と、入力された音声の音質、音量または入力テンポの変
化を検出する音声変化検出部と、検出された音声の変化
に応じて所定の文字パターンとは異なる文字パターンに
変換する指示を含む属性情報を生成して文字コード列に
付加する属性情報付加部と、文字コード列をその付加さ
れた属性情報に対応する文字パターン列に変換する文字
パターン変換部と、変換された文字パターン列を出力す
る出力部とから構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声を認識し
て文字列に変換し、その文字列を表示データまたは印刷
データに作成して出力する音声処理装置及び方法並びに
音声処理プログラムを記憶した記憶媒体に関する。
【0002】
【従来の技術】音声合成技術や音声認識技術などの音声
処理技術の進歩に伴って、従来から各種の電子機器にお
いて利用されてきている。例えば、キャッシュサービス
機器の操作説明、駐車券発行機、車用ナビゲーションの
案内などに音声合成技術が用いられ、一方、入力音声に
よる電子機器の操作、音声データから文字データへの変
換などに音声認識技術が用いられている。
【0003】特開平6―4090号公報の記載によれ
ば、文字認識技術と音声合成技術を用いて、テキストに
表記されている強調部分を検出し、その強調部分の音声
を強調して出力することにより、テキストに表現されて
いる強調部分を明確に表現することができるテキスト音
声変換方法が提案されている。また、特開平6―379
46号公報の記載によれば、音声認識技術を用いて、音
声で入力された文章をファクシミリ信号に変換する音声
認識ファクシミリ装置が提案されている。また、特開平
9―116648号公報の記載によれば、音声認識技術
を用いて、入力音声を文字に変換して文字通信する携帯
用通信装置が提案されている。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
6―4090号公報に記載のテキスト音声変換方法や特
開平6―37946号公報に記載の携帯用通信装置は、
音声から文字に単純に変換する処理であるので、音声か
ら変換された文書からは、話者が、どの言葉を強調した
かったのか視覚的に容易に容易に取れるよう構成されて
いない。一方、特開平6―4090号公報の記載のテキ
スト音声変換方法は、テキストから音声に変換する際に
テキストの強調部分を音声でも強調するよう変換するこ
とができるが、音声からテキストに変換する方法につい
ては記載されていない。
【0005】本発明は以上の事情を考慮してなされたも
ので、例えば、入力音声を文書に変換する際、話者が意
図的に強調して入力した音声の部分を視覚的に容易に読
み取れる文書に変換する音声処理装置及び方法並びにこ
れに利用される記憶媒体を提供する。
【0006】
【課題を解決するための手段】本発明は、音声を入力す
る音声入力部と、入力された音声を認識して文字コード
列に変換する音声認識部と、入力された音声の音質、音
量または入力テンポの変化を検出する音声変化検出部
と、検出された音声の変化に応じて所定の文字パターン
とは異なる文字パターンに変換する指示を含む属性情報
を生成して文字コード列に付加する属性情報付加部と、
文字コード列をその付加された属性情報に対応する文字
パターン列に変換する文字パターン変換部と、変換され
た文字パターン列を出力する出力部とを備えたことを特
徴とする音声処理装置である。本発明によれば、入力音
声を文書に変換する際、話者が意図的に強調して入力し
た音声の部分を視覚的に容易に読み取れる文書に変換す
ることができる。
【0007】音声を入力する話者の通常発声状態におけ
る音質、音量または入力テンポの基準値を予め登録した
音声登録テーブルをさらに備え、前記音声変化検出部
は、前記音声登録テーブルに登録された話者の基準値と
に入力された話者の音声の音質、音量または入力テンポ
とを比較して、その話者の音声変化を検出する構成にし
てもよい。この構成によれば、音声を入力する話者の通
常発声状態の音質、音量、入力テンポが登録されている
ので、音声を入力する話者が変わっても、音声を入力し
た話者の通常発声状態とは異なる音質、音量または入力
テンポの音声変化を正確に検出することができる。
【0008】前記属性情報付加部は、前記音声変化検出
部によって検出された音声の音質が高いまたは音量が大
きいときは、拡大したまたは太い線の文字パターンに変
換するための指示を含む属性情報を付加し、音質が低い
または音量が小さいときは、縮小したまたは細い線の文
字パターンに変換するための指示を含む属性情報を生成
する構成にしてもよい。この構成によれば、変換された
文字パターンの線の太さ、文字サイズから話者が意図的
に強調して入力した音声の部分を視覚的に容易に読み取
れることができる。
【0009】前記音声変化検出部は、前記音声入力部に
よって入力される音声の入力テンポの変化を検出した
際、前記属性情報付加部は、音声の入力テンポが変化し
たことを示す符号を文字コード間に挿入する構成にして
もよい。この構成によれば、例えば、音声の入力テンポ
を伸ばした単語が入力されたとき、“ー”の長音符号や
“〜”の符号を文字列に挿入して出力することができる
ので、正確な表現の単語に変換して文書に作成すること
ができる。
【0010】前記属性情報付加部は、前記音声認識部に
よって変換された文字コードの出現回数をカウントし、
同文字コード列の出現回数が所定回数より多いとき、同
文字コード列が重要事項であると判定して所定の文字パ
ターンとは異なる文字パターンに変換する指示を含む属
性情報を生成する構成にしてもよい。この構成によれ
ば、話者が意図的に繰り返した音声の部分を視覚的に容
易に読み取れることができる。
【0011】本発明の別の観点によれば、音声入力部を
用いて、音声を入力し、音声認識部を用いて、入力され
た音声を認識して文字コード列に変換し、音声変化検出
部を用いて、入力された音声の音質や音量の変化を検出
し、属性情報付加部を用いて、検出された音声の変化に
応じて所定の文字パターンとは異なる文字パターンに変
換する指示を含む属性情報を生成して文字コードに付加
し、文字パターン変換部を用いて、文字コード列をその
付加された属性情報に対応する文字パターン列に変換
し、出力部を用いて、変換された文字パターン列を出力
することを特徴とする音声処理方法が提供される。
【0012】また、本発明の別の観点によれば、音声入
力部を用いて、音声を入力する機能と、音声認識部を用
いて、入力された音声を認識して文字コード列に変換す
る機能と、音声変化検出部を用いて、入力された音声の
音質や音量の変化を検出する機能と、属性情報付加部を
用いて、検出された音声の変化に応じて所定の文字パタ
ーンとは異なる文字パターンに変換する指示を含む属性
情報を生成して文字コードに付加する機能と、文字パタ
ーン変換部を用いて、文字コード列をその付加された属
性情報に対応する文字パターン列に変換する機能と、出
力部を用いて、変換された文字パターン列を出力する機
能とをコンピュータに実行させる音声処理プログラムを
記憶した記憶媒体が提供される。
【0013】
【発明の実施の形態】以下、図に示す実施例に基づいて
本発明を詳述する。なお、本発明はこれによって限定さ
れるものではない。
【0014】図lは本発明の―実施例である音声処理装
置のハード構成を示すブロック図である。図1に示すよ
うに、本実施例の音声処理装置は、主制御部1、データ
記憶部2、プログラム記億部3、キーボ―ド4、キーボ
ード制御部5、マイクロホン6、AD変換部7、音声入
力制御部8、画面制御部9、表示装置10、画像データ
記憶部11、プリンタ制御部12、プリンタ13、バス
14、記憶媒体15、記憶媒体読取部16から構成され
ている。
【0015】主制御部1は、CPU、ROM、RAM、
I/Oポートからなるコンピュータで構成され、バス1
4を介してプログラム記憶部3に記憶された制御プログ
ラムによって本装置の動作全体を制御する。
【0016】データ記憶部2は、RAM、EEPRO
M、フロッピーディスク、ハードディスクなどの記憶媒
体で構成され、主制御部1の制御によって各種データの
書き込み、読み出しをする。また、データ記憶部2は、
音声分析、特徴検出、音素認識、構文解析などの処理を
行って音声データを文字コードに変換する音声文字変換
辞書、仮名漢字変換辞書、各種書体、文字サイズの文字
フォントを記憶したテーブル、音声を入力する話者の通
常発声状態における音質、音量または入力テンポの基準
値を予め登録した音声登録テーブルとして機能する領域
を備えている。これらの辞書、各テーブルはプログラム
記憶部3の領域に備えてもよい。
【0017】プログラム記憶部3は、ROM、EEPR
OM、フロッピーディスク、ハードディスクなどの記憶
媒体で構成され、主制御部1が各部を制御するための制
御プログラムや本発明の音声処理プログラムなどが記憶
されている。また、主制御部1は、プログラム記憶部3
に記憶された本発明の音声処理プログラムにより、マイ
クロホン6から入力された音声を認識して文字コード列
に変換する音声認識部、その入力された音声の音質、音
量または入力テンポの変化を検出する音声変化検出部、
検出された音声の変化に応じて所定の文字パターンとは
異なる文字パターンに変換する指示を含む属性情報を生
成して文字コード列に付加する属性情報付加部、文字コ
ード列をその付加された属性情報に対応する文字パター
ン列に変換する文字パターン変換部として機能する。
【0018】キーボード4は、使用者が本装置に対して
入力操作行うための入力装置である。キーボード制御部
5は、キーボード4のキー入力を認識し、主制御部1に
認識結果を転送する。マイクロホン6は、音声で文書を
入力する音声入力部として機能し、音声をアナログの音
声信号に変換する。
【0019】AD変換部7は、主制御部1の制御によっ
て、マイクロホン6から入力されたアナログの音声信号
をデジタルの音声データに変換する。音声入力制御部8
は、AD変換部7から送られた音声データを主制御部1
に送る。主制御部1は、音声入力制御部8から送られた
音声データを認識して、音声文字変換辞書など参照して
音声データを文字コード、文字パターンへと順次変換す
る。
【0020】表示装置10は、例えば、CRTディスプ
レイ、LCD(液晶ディスプレイ)、PD(プラズマデ
ィスプレイ)、ELディスプレイなど構成され、画面制
御部9によって制御され、表示データ記憶部11に記憶
された画像データを画面に表示する。画像データ記憶部
11は、主制御部1の制御によって、画像データの書き
込み及び読み出しが行われる。
【0021】プリンタ13は、サーマルプリンタ、レー
ザプリンタなどで構成され、プリンタ制御部12によっ
て制御される。バス14は、主制御部1によって各部を
制御するためのアドレスデータ、プログラムデータ、音
声データ、文書データなど各種データを転送する。
【0022】記憶媒体15は、RAM、EEPROM、
フロッピーディスク、ハードディスク、CD−ROMな
どの記憶媒体で構成され、音声入力部を用いて、音声を
入力する機能と、音声認識部を用いて、入力された音声
を認識して文字コード列に変換する機能と、音声変化検
出部を用いて、入力された音声の音質や音量の変化を検
出する機能と、属性情報付加部を用いて、検出された音
声の変化に応じて所定の文字パターンとは異なる文字パ
ターンに変換する指示を含む属性情報を生成して文字コ
ードに付加する機能と、文字パターン変換部を用いて、
文字コード列をその付加された属性情報に対応する文字
パターン列に変換する機能と、出力部を用いて、変換さ
れた文字パターン列を出力する機能とを主制御部1のコ
ンピュータに実行させる音声処理プログラムを記憶して
もよい。
【0023】例えば、プログラム記憶部に、本発明の音
声処理プログラムを記憶していない情報処理装置におい
ても、記憶媒体読取部16を用いて、記憶媒体15に記
憶された本発明の音声処理プログラムを読み取り、プロ
グラム記憶部3にインストールすることにより、話者が
意図的に強調して入力した音声の部分を視覚的に理解す
ることができる音声処理装置を実現することができる。
【0024】図2は本実施例の音声処理装置の機能構成
を示すブロック図である。図2に示すように、マイクロ
ホン6により入力されたアナログの音声信号は低域通過
フィルターを通過してAD変換部7によりAD変換を行
ってデジタルの音声データに変換される。音声認識部2
1は、デジタルとなった音声データを、音声分析、特徴
検出、音素認識、構文解析などの処理を行って文字コー
ドに変換するための音声文字変換テーブルを備えてい
る。音声文字変換テーブルは、音素認識するための音素
認識テーブル、単語構文解析するための単語構文解析テ
ーブル、単語を認識するための単語認識辞書などが含ま
れる。
【0025】音声変化検出部22は、音声登録テーブル
を参照して、入力された話者の音声信号の音質や音量の
変化を検出する。
【0026】属性情報付加部23は、音声変化検出部2
2によって検出された音声の変化(話者の音量、音質、
入力テンポの変化量)に応じて所定の文字パターンとは
異なる文字パターンに変換する指示を含む属性情報を生
成して文字コード列に付加する。この属性情報として
は、書体、文字サイズ、文字の太さ、斜体文字、下線、
色などを変更する指示が含まれる。また、属性情報付加
部23は、音声の変化が基準値を越えたときの各属性情
報を記憶した属性情報テーブルを備えている。
【0027】文字パターン変換部24は、文字コード列
を文字パターン列に変換する際、属性情報が付加されて
いるか否か判定し、文字コードに属性情報が付加されて
いれば、その属性情報に対応する文字パターン列に変換
する。また、文字パターン変換部24は、話者の入力音
声の大小強弱などを示す属性情報に基づいて強調文字
(太さ)、拡大文字などの文字フォントを選択して置換
する文字フォントテーブルなどを備えている。
【0028】画面制御部9やプリンタ制御部12は、文
字パターン変換部24により変換された文字パターンを
画像データや印刷データに変換して表示装置10の画面
上やプリンタ13にセットされた用紙に出力する。
【0029】図3は本実施例の音声認識処理の手順を示
すフローチャートである。図3では、主として、音声認
識部21の動作について説明する。 S1:マイクロホンから音声信号が入力されると、低域
フイルタでノイズを除去した後、その音声信号を周波数
スペクトルによって大まかな音声分析を行う。 S2:この分析結果から特徴パラメータを検出して時系
列信号に変換する。 S3:音声単位へのセグメンテーションを行う。 S4:各セグメントと音声文字変換テーブルに予め記憶
された音素標準パターンとの比較により音素認識を行っ
て音素系列(音声データ)を作成する。
【0030】S5:この音素系列を音声文字変換テーブ
ルに予め記憶された単語標準パターンと単語照合をす
る。 S6:単語認識を行う。 S7:音声文字変換テーブルに該当する単語標準パター
ンが無ければ、現在の音素を単語標準パターンとして学
習する。 S8:学習した単語標準パターンを音声文字変換テーブ
ルに追加保持する。
【0031】S9:音素列から得た単語を構文パターン
と照合する。 S10:構文パターンとの照合で構文認識する。 S11:この単語構文の認識が正確であれば、単語列
(文字コード列)の文が意味的に妥当であるか否かを調
べる。 Sl2:結果が不十分ならば、妥当な結果が得られるま
で、S9〜S12の構文認識処理を繰り返す。 S13:妥当な結果が得られた場合に改めて意味認識を
行い、文字認識結果(文字コード)を出力する。
【0032】図4は本実施例の属性情報付加処理(1)
の手順を示すフローチャートである。図4において、音
声変化検出部22と属性情報付加部23の動作について
説明する。 S21:音声変化検出部22は、音声認識部21で認識
された単語毎の音声データの振幅により単語の入力音の
大きさを検出する。 S22:属性情報付加部23は、音声登録テーブルに登
録された話者の基準値となる音量/音質との比較を行
い、基準値より入力音が大きければ、次のS23の処理
に進み、基準値となる音量より入力音が小さければ、こ
れに関連する属性情報を生成しないで処理を終了する。
【0033】S23:基準値となる音量より大きい音声
が入力されていた場合、その音量により文字サイズ、文
字の太さなどを指示する属性情報を決定して生成する。 S24:生成した属性情報を文字コード(単語)に付加
する。 S25:文字パターン変換部24は、文字コードを付加
された属性情報に対応する文字パターンに変換して出力
する(図5参照)。
【0034】図5は本実施例の音量の変化に関連する属
性情報によって処理された文字列を示す図である。図5
において、(a)に示すように、入力波形に示す音量の
大きさの音声で、文「おおきなこえでにゅうりょくす
る」が入力され、(b)に示すように、音声認識部21
により文字列「大きな声に入力する」に変換されたとす
る。ここで、「おおきなこえ」の部分が、基準値より大
きな音量で入力されているとすると、属性情報が付加さ
れた「大きな声」の部分が、(c)に示す「文字サイ
ズ」、(d)に示す「強調」、(e)に示す「斜体」、
(f)に示す「下線」、(g)に示す「書体」、(h)
に示す「色」に変更される。
【0035】図6は本実施例の属性情報付加処理(2)
の手順を示すフローチャートである。図6では、音声変
化検出部22が音声の入力テンポの変化を検出したとき
の属性情報付加部23の動作について説明する。 S31:音声変化検出部22は、音声認識部21で認識
された単語毎の音声データより単語の中の長音を検出す
る。 S32:属性情報付加部23は、音声登録テーブルに登
録された話者の基準時間となる音声の入力テンポとの比
較を行い、基準時間より入力テンポが長ければ、次のS
33の処理に進み、基準値より入力テンポが小さけれ
ば、これに関連する属性情報は生成しないで処理を終了
する。
【0036】S33:基準時間より長い入力テンポで単
語が入力されていた場合、その入力時間によって「ー」
や「〜」など予め決められた符号を付加する属性情報を
生成する。 S34:生成した属性情報を文字コード(単語)に付加
する。 S35:文字パターン変換部24は、文字コードを付加
された属性情報に対応する文字パターンに変換して出力
する(図7参照)。
【0037】図7は本実施例の入力テンポの変化に関連
する属性情報によって処理された文字列を示す図であ
る。図7において、文「ながくのばす」が入力され、音
声認識部21により文字列「長く伸ばす」に変換された
とする。入力中「ながく」の「が」が基準時間より長い
入力テンポで入力されていると、長音の属性情報「ー」
や「〜」が、(a)に示す「ながーく」や(b)に示す
「なが〜く」に変換され表示される。
【0038】図8は本実施例の属性情報付加処理(3)
の手順を示すフローチャートである。図8では、音声認
識部21で認識された同単語の出現回数が多いときの属
性情報付加部23の動作について説明する。 S41:属性情報付加部23は、音声認識部21で認識
された同単語(文字コード列)の出現回数をカンウトす
る。 S42:予め設定した基準回数との比較を行い、基準回
数より出現回数が多ければ、次のS43の処理に進み、
基準回数より出現回数が少なければ、これに関連する属
性情報を生成しないで処理を終了する。
【0039】S43:単語の出現回数が基準回数より多
い場合、その出現回数により文字サイズ、文字の太さな
どを指示する属性情報を決定して生成する。 S44:生成した属性情報を文字コード(単語)に付加
して出力する。 S45:文字パターン変換部24は、文字コードを付加
された属性情報に対応する文字パターンに変換して出力
する。
【0040】属性情報付加部で予め保持する各基準値
は、一般的な基準で決定する方法のほかに、学習により
話者の通常の基準値を記憶してもよい。これにより、正
確な属性情報を付加することができる。
【0041】
【発明の効果】本発明によれば、入力音声を文書に変換
する際、話者が意図的に強調して入力した音声の部分を
視覚的に容易に読み取れる文書に変換することができ
る。
【図面の簡単な説明】
【図1】本発明の―実施例である音声処理装置のハード
構成を示すブロック図である。
【図2】本実施例の音声処理装置の機能構成を示すブロ
ック図である。
【図3】本実施例の音声認識処理の手順を示すフローチ
ャートである。
【図4】本実施例の属性情報付加処理(1)の手順を示
すフローチャートである。
【図5】本実施例の音量の変化に関連する属性情報によ
って処理された文字列を示す図である。
【図6】本実施例の属性情報付加処理(2)の手順を示
すフローチャートである
【図7】本実施例の入力テンポの変化に関連する属性情
報によって処理された文字列を示す図である。
【図8】本実施例の属性情報付加処理(3)の手順を示
すフローチャートである。
【符号の説明】
l 主制御部 2 データ記憶部 3 プログラム記憶部 4 キーボード 5 キーボード制御部 6 マイクロホン 7 AD変換部 8 音声入力制御部 9 画面制御御部 10 表示装置 ll 画像データ記憶部 12 プリンタ制御部 13 プリンタ 14 バス 15 記憶媒体 16 記憶媒体読取部 21 音声認識部 22 音声変化検出部 23 属性情報付加部 24 文字パターン変換部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/28

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する音声入力部と、入力され
    た音声を認識して文字コード列に変換する音声認識部
    と、入力された音声の音質、音量または入力テンポの変
    化を検出する音声変化検出部と、検出された音声の変化
    に応じて所定の文字パターンとは異なる文字パターンに
    変換する指示を含む属性情報を生成して文字コード列に
    付加する属性情報付加部と、文字コード列をその付加さ
    れた属性情報に対応する文字パターン列に変換する文字
    パターン変換部と、変換された文字パターン列を出力す
    る出力部とを備えたことを特徴とする音声処理装置。
  2. 【請求項2】 音声を入力する話者の通常発声状態にお
    ける音質、音量または入力テンポの基準値を予め登録し
    た音声登録テーブルをさらに備え、前記音声変化検出部
    は、前記音声登録テーブルに登録された話者の基準値と
    に入力された話者の音声の音質、音量または入力テンポ
    とを比較して、その話者の音声変化を検出することを特
    徴とする請求項1記載の音声処理装置。
  3. 【請求項3】 前記属性情報付加部は、前記音声変化検
    出部によって検出された音声の音質が高いまたは音量が
    大きいときは、拡大したまたは太い線の文字パターンに
    変換するための指示を含む属性情報を付加し、音質が低
    いまたは音量が小さいときは、縮小したまたは細い線の
    文字パターンに変換するための指示を含む属性情報を生
    成することを特徴とする請求項1記載の音声処理装置。
  4. 【請求項4】 前記音声変化検出部は、前記音声入力部
    によって入力される音声の入力テンポの変化を検出した
    際、前記属性情報付加部は、音声の入力テンポが変化し
    たことを示す符号を文字コード間に挿入することを特徴
    とする請求項1記載の音声処理装置。
  5. 【請求項5】 前記属性情報付加部は、前記音声認識部
    によって変換された文字コードの出現回数をカウント
    し、同文字コード列の出現回数が所定回数より多いと
    き、同文字コード列が重要事項であると判定して所定の
    文字パターンとは異なる文字パターンに変換する指示を
    含む属性情報を生成することを特徴とする請求項1記載
    の音声処理装置。
  6. 【請求項6】 音声入力部を用いて、音声を入力し、音
    声認識部を用いて、入力された音声を認識して文字コー
    ド列に変換し、音声変化検出部を用いて、入力された音
    声の音質や音量の変化を検出し、属性情報付加部を用い
    て、検出された音声の変化に応じて所定の文字パターン
    とは異なる文字パターンに変換する指示を含む属性情報
    を生成して文字コードに付加し、文字パターン変換部を
    用いて、文字コード列をその付加された属性情報に対応
    する文字パターン列に変換し、出力部を用いて、変換さ
    れた文字パターン列を出力することを特徴とする音声処
    理方法。
  7. 【請求項7】 音声入力部を用いて、音声を入力する機
    能と、音声認識部を用いて、入力された音声を認識して
    文字コード列に変換する機能と、音声変化検出部を用い
    て、入力された音声の音質や音量の変化を検出する機能
    と、属性情報付加部を用いて、検出された音声の変化に
    応じて所定の文字パターンとは異なる文字パターンに変
    換する指示を含む属性情報を生成して文字コードに付加
    する機能と、文字パターン変換部を用いて、文字コード
    列をその付加された属性情報に対応する文字パターン列
    に変換する機能と、出力部を用いて、変換された文字パ
    ターン列を出力する機能とをコンピュータに実行させる
    音声処理プログラムを記憶した記憶媒体。
JP33332099A 1999-11-24 1999-11-24 音声処理装置及び方法並びにこれに利用される記憶媒体 Pending JP2001147919A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33332099A JP2001147919A (ja) 1999-11-24 1999-11-24 音声処理装置及び方法並びにこれに利用される記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33332099A JP2001147919A (ja) 1999-11-24 1999-11-24 音声処理装置及び方法並びにこれに利用される記憶媒体

Publications (1)

Publication Number Publication Date
JP2001147919A true JP2001147919A (ja) 2001-05-29

Family

ID=18264801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33332099A Pending JP2001147919A (ja) 1999-11-24 1999-11-24 音声処理装置及び方法並びにこれに利用される記憶媒体

Country Status (1)

Country Link
JP (1) JP2001147919A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006184921A (ja) * 2006-01-27 2006-07-13 Canon Electronics Inc 情報処理装置及び方法
CN101604521B (zh) * 2008-06-12 2012-07-11 Lg电子株式会社 移动终端和用于识别其语音的方法
JP2013015693A (ja) * 2011-07-05 2013-01-24 Nippon Telegr & Teleph Corp <Ntt> はなし言葉分析装置とその方法とプログラム
US8676578B2 (en) 2010-09-28 2014-03-18 Kabushiki Kaisha Toshiba Meeting support apparatus, method and program
US8793124B2 (en) 2001-08-08 2014-07-29 Nippon Telegraph And Telephone Corporation Speech processing method and apparatus for deciding emphasized portions of speech, and program therefor
CN109994111A (zh) * 2019-02-26 2019-07-09 维沃移动通信有限公司 一种交互方法、装置及移动终端

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793124B2 (en) 2001-08-08 2014-07-29 Nippon Telegraph And Telephone Corporation Speech processing method and apparatus for deciding emphasized portions of speech, and program therefor
JP2006184921A (ja) * 2006-01-27 2006-07-13 Canon Electronics Inc 情報処理装置及び方法
CN101604521B (zh) * 2008-06-12 2012-07-11 Lg电子株式会社 移动终端和用于识别其语音的方法
US8600762B2 (en) 2008-06-12 2013-12-03 Lg Electronics Inc. Mobile terminal and method for recognizing voice thereof
US8676578B2 (en) 2010-09-28 2014-03-18 Kabushiki Kaisha Toshiba Meeting support apparatus, method and program
JP2013015693A (ja) * 2011-07-05 2013-01-24 Nippon Telegr & Teleph Corp <Ntt> はなし言葉分析装置とその方法とプログラム
CN109994111A (zh) * 2019-02-26 2019-07-09 维沃移动通信有限公司 一种交互方法、装置及移动终端

Similar Documents

Publication Publication Date Title
EP1096472B1 (en) Audio playback of a multi-source written document
US6490563B2 (en) Proofreading with text to speech feedback
KR100769033B1 (ko) 스피치 합성 방법
JPS6147440B2 (ja)
JPWO2007097390A1 (ja) 音声認識システム、音声認識結果出力方法、及び音声認識結果出力プログラム
JPH0352058A (ja) 音声入力の文書処理装置
JPH06110494A (ja) 発音学習装置
JP2001147919A (ja) 音声処理装置及び方法並びにこれに利用される記憶媒体
JP5152588B2 (ja) 声質変化判定装置、声質変化判定方法、声質変化判定プログラム
JP5088109B2 (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP3718088B2 (ja) 音声認識修正方式
JPH04248596A (ja) 音声認識訂正装置
JP2001134289A (ja) 音声認識システム、方法及び記録媒体
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JP3029403B2 (ja) 文章データ音声変換システム
JP2001067096A (ja) 音声認識結果評価装置および記録媒体
JPH03217900A (ja) テキスト音声合成装置
JP2014059330A (ja) 音調表示制御装置およびプログラム
Chypak et al. AUDIO READING ASSISTANT FOR VISUALLY IMPAIRED PEOPLE
JPWO2005076259A1 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JPH10143503A (ja) 音声ワードプロセッサ
JP2021128222A (ja) 情報処理装置及びプログラム
JPH06103457B2 (ja) 音声タイプライタ
JP2006119377A (ja) 音声入力装置及び方法、並びにプログラム及び記憶媒体
JPH06214593A (ja) 文書作成装置