JP2002341890A - 音声認識文字表示方法およびその装置 - Google Patents

音声認識文字表示方法およびその装置

Info

Publication number
JP2002341890A
JP2002341890A JP2001148223A JP2001148223A JP2002341890A JP 2002341890 A JP2002341890 A JP 2002341890A JP 2001148223 A JP2001148223 A JP 2001148223A JP 2001148223 A JP2001148223 A JP 2001148223A JP 2002341890 A JP2002341890 A JP 2002341890A
Authority
JP
Japan
Prior art keywords
character
voice
unit
character display
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001148223A
Other languages
English (en)
Inventor
Takeo Oono
剛男 大野
Keiko Morii
景子 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001148223A priority Critical patent/JP2002341890A/ja
Publication of JP2002341890A publication Critical patent/JP2002341890A/ja
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 音声信号に含まれる言語情報と音声特性情報
の双方を迅速かつ簡便に理解できる音声認識文字表示装
置を提供することを目的とする。 【解決手段】 音声認識部12で、音声認識処理を行
い、音声信号中にふくまれる言語情報を文字系列として
出力する。また、音声特性情報判定部14で、音声信号
の大きさや話者など、音声信号に含まれる言語情報以外
の特性情報の判定を行う。文字画像作成部15にて、特
性情報と、所定の文字表示様式規則を照らし合わせ、認
識結果の文字系列をモニタ受像部16にて表示する際の
文字の大きさ、色、文字間隔など、文字の表示様式を決
定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識された文
字をモニタに画面表示するようにした音声認識文字表示
装置に関する。
【0002】
【従来の技術】従来、音声認識文字表示装置は特開平1
1−41538号公報に記載されたものが知られてい
る。
【0003】図5に従来の音声認識文字表示装置の構成
図を示しており、音声信号を獲得する音声信号獲得部5
1と、音声信号獲得部51から音声信号を供給され、音
声信号中に含まれる言語情報を判別する音声認識部52
と、音声認識部52から供給される言語情報に対応した
文字から文字画像を作成する、文字画像作成部55と、
文字画像作成で作成された、文字画像を画像出力するモ
ニタ受像部56から構成されている。
【0004】このような、音声認識文字表示装置は、例
えば、テレビジョン放送信号中の音声信号を音声認識し
て認識結果を映像出力することにより、聴覚障害者にも
音声信号の内容を伝達できるようにする自動字幕表示作
成装置としての利用や、あるいは、機械翻訳機能を付加
することにより、外国語によるテレビジョン放送に対し
て自動的に母国語の字幕を作成する装置としての利用が
考えられてきた。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の音声認識文字表示装置においては、音声信号に含ま
れる様々な情報のうち、言語情報のみが文字表示装置を
通して伝達されており、例えば、声の大きさや発声の速
度、あるいは、発話者が誰であるのかといった、音声信
号に含まれる言語情報以外の情報(以下、これら音声信
号に含まれる言語情報以外の情報を音声特性情報と呼
ぶ)を伝達することができなかった。このため、例え
ば、テレビジョン放送信号中に含まる複数の発話者の発
した音声信号を文字情報として表示するために上記従来
の音声認識文字表示装置を用いた場合、各文字出力が、
どの話者が発した音声に対応したものなのかを伝達する
ことができないという課題があった。さらに、この音声
認識対象となるテレビジョン放送音声が、ドラマ番組中
の出演者の発声のように、発話音声の大きさに演出上の
効果が込められている場合、音声認識文字表示装置を通
じて伝達されるのは言語情報のみであるため、声の大小
によって表現される演出上の効果を伝達することはでき
ないという課題があった。
【0006】本発明は、以上のような従来の音声認識文
字表示装置の課題を鑑みてなされたものであって、音声
認識結果の表示出力に際し、文字により表現される言語
情報以外の音声特性情報も同時に伝達することが可能
で、モニタを通じて音声認識結果を確認するユーザが、
音声信号に含まれる言語情報と音声特性情報の双方を迅
速かつ簡便に理解できる音声認識文字表示装置を提供す
ることを目的とする。
【0007】
【課題を解決するための手段】この課題を解決するため
に本発明は、音声認識部において、音声信号に含まれる
言語情報を認識するとともに、あわせて、音声特性情報
判別部において、声の大きさや発声の速度、あるいは、
発話者が誰であるのかといった、音声信号に含まれる言
語情報以外の音声特性情報を判別し、言語情報の出力手
段である文字出力時に、判別された音声特性情報に応じ
て、文字の大きさ、色、文字間隔など、文字出力の様式
を所定の規則にしたがって制御し文字画像を作成し、こ
れをモニタ受像機により出力するように構成したもので
ある。
【0008】これにより、音声認識結果の出力時に、音
声信号に含まれる言語情報と音声特性情報の双方を、出
力文字表示により同時に伝達することができる。
【0009】
【発明の実施の形態】本発明の請求項1に記載の発明
は、音声信号を獲得する音声信号獲得部と、前記音声信
号獲得部から音声信号を供給され、音声信号中に含まれ
る言語情報を判別する音声認識部と、前記音声信号獲得
部から音声信号を供給され、音声信号中に含まれる話者
ならびに発声の様態に関する音声特性情報を判別する音
声特性判別部と、あらかじめ定められた文字表示様式規
則を格納する文字表示様式規則格納部と、前記音声特性
判別部から供給される音声特性情報と、前記文字表示様
式規則格納部に格納される文字表示様式規則とに基づ
き、前記音声認識部から供給される言語情報に対応した
文字の表示様式を決定し文字画像を作成する文字画像作
成部と、前記文字画像作成部で作成された文字画像を画
像出力するモニタ受像部とから構成されることを特徴と
する音声認識文字表示装置としたものであり、音声認識
結果の出力時に、音声信号に含まれる言語情報と音声特
性情報の双方を、出力文字表示により同時に伝達すると
いう作用を有する。
【0010】請求項2に記載の発明は、請求項1に記載
の音声認識文字表示装置であって、前記音声信号獲得部
は、テレビジョン放送音声信号を獲得し、モニタ受像部
は、テレビジョン受像機のモニタ受像部としたものであ
り、特に、テレビジョン放送中の音声信号について、音
声認識結果の出力時に、音声信号に含まれる言語情報と
音声特性情報の双方を、テレビジョン受像機のモニタへ
の出力文字表示により同時に伝達するという作用を有す
る。
【0011】請求項3に記載の発明は、請求項1に記載
の音声認識文字表示装置であって、前記文字表示様式規
則格納部に格納される文字表示様式規則は、話者毎に表
示文字の色、文字の大きさ、文字のフォント、文字の太
さ、文字表示する際のモニタ画面上の位置の少なくとも
1つを変えることを特徴とするもので、話者毎に表示の
仕方を変えることにより、効果的な伝達ができるという
作用を有する。
【0012】請求項4に記載の発明は、音声信号を獲得
する音声信号獲得部と、前記音声特性情報を獲得する音
声特性獲得部と、前記音声信号獲得部から音声信号を供
給され、音声信号中に含まれる言語情報を判別する音声
認識部と、あらかじめ定められた文字の表示様式規則を
格納する文字表示様式規則格納部と、前記音声特性獲得
部で獲得された音声特性情報と、前記文字表示様式規則
格納部に格納される文字表示様式規則とに基づき、前記
音声認識部から供給される言語情報に対応した文字の表
示様式を特定し文字画像を作成する文字画像作成部と、
前記文字画像作成部で作成された文字画像を画像出力す
るモニタ受像部とから構成されることを特徴とする音声
認識文字表示装置としたものであり、音声認識結果の出
力時に、音声信号に含まれる言語情報と音声特性情報の
双方を、出力文字表示により同時に伝達するという作用
を有する。
【0013】請求項5に記載の発明は、請求項4に記載
の音声認識文字表示装置であって、音声信号獲得部は、
テレビジョン放送音声信号を獲得し、音声特性獲得部
は、テレビジョン放送信号から音声特性情報を獲得し、
モニタ受像部は、テレビジョン受像機のモニタ受像部と
したものであり、特に、テレビジョン放送中の音声信号
について、音声認識結果の出力時に、音声信号に含まれ
る言語情報と音声特性情報の双方を、テレビジョン受像
機のモニタへの出力文字表示により同時に伝達するとい
う作用を有する。
【0014】以下、本発明の実施の形態について、図を
用いて説明する。
【0015】(実施の形態1)図1は、本発明の実施の
形態1における音声認識文字表示装置を示すブロック構
成図、図2は、図1に示した音声認識部内部の構成を示
すブロック構成図、図3は、図1に示す音声特性判定部
内部の構成を示すブロック構成図である。
【0016】図1において、音声信号獲得部11は、マ
イクロフォン、あるいは、テレビ放送信号から音声信号
を抽出する回路などから構成され、発話者の発声やテレ
ビ放送信号から、音声認識の対象となる音声信号を抽出
し、抽出した音声信号を、音声認識部12と音声特性情
報判定部13に供給する。音声認識部12では、音声信
号獲得部11から供給された音声信号に対して音声認識
処理を行い、音声信号中にふくまれる言語情報を文字系
列として出力する。また、音声特性情報判定部13で
は、音声信号獲得部11から供給された音声信号に対し
話者認識処理を行い、音声信号が、あらかじめ登録され
た話者のうちいずれの話者の発声によるものであるかを
判定した話者認識結果を出力する。文字画像作成部15
では、音声特性情報判別部13から供給された話者認識
結果から、文字表示様式規則格納部に格納される規則を
参照して、表示する音声認識結果の文字の色を特定し、
音声認識部12から供給される音声認識結果に対応した
文字にこの特定された色を適用することにより、文字画
像を作成する。文字画像作成部で作成された文字画像
は、モニタ受像機16に供給され、モニタ受像機16に
て表示される。
【0017】上記のように構成された音声認識文字表示
装置の各部について、詳細に説明する。
【0018】音声認識部12の内部の詳細構成図を図2
に示し、以下に詳細に説明する。
【0019】音声認識部12では、図2に示すように、
A/D変換器21と、音響分析部22と、音響モデル2
3と、言語モデル24と、尤度算出部24とから構成さ
れる。
【0020】音声認識部12に音声信号が供給される
と、まず、A/D変換器21にて、音声の音響特徴量を
抽出するのに充分なサンプリング周波数でデジタル化
し、デジタル化された音声信号を、音響分析部22に供
給する。音響分析部22では、デジタル化された音声信
号を、LPCケプストラム係数やFFTケプストラム係
数など、音声の認識に適した音響パラメータに変換し、
尤度算出部25に供給する。尤度算出部25では、音響
分析部22から供給された音響パラメータと、隠れマル
コフモデル(Hidden Markov Model:HMM)法に基づきあ
らかじめ学習された、音響モデル23と言語モデル24
を参照し、入力された音声信号が、いずれの文章を発話
した音声に最も類似しているかの尤度計算を行い、最も
類似した文章を、音声認識結果として、文字画像作作成
部15へ供給する。
【0021】次に、音声特性情報判定部13の詳細なブ
ロック構成図を図3に示し、以下に詳細に説明する。
【0022】音声特性情報判定部13は、図3に示すよ
うに、A/D変換器31と、音響分析部32と、話者モ
デル33とから構成されている。
【0023】音声特性情報判定部13に音声信号が供給
されると、まず、A/D変換器31にて、音声の音響特
徴量を抽出するのに充分なサンプリング周波数でデジタ
ル化し、デジタル化された音声信号を、音響分析部32
に供給する。
【0024】音響分析部32では、デジタル化された音
声信号を、LPCケプストラム係数やFFTケプストラ
ム係数など、話者の認識に適した音響パラメータに変換
し、尤度算出部35に供給する。
【0025】尤度算出部35では、音響分析部32から
供給された音響パラメータと、HMM法に基づきあらか
じめ学習された話者モデル33を参照し、入力された音
声信号が、いずれの話者が発話した音声に最も類似して
いるかの尤度計算を行い、最も類似した話者を、話者認
識結果として、文字画像作作成部15へ供給する。
【0026】次に、文字表示様式規則格納部14につい
て説明する。
【0027】文字表示様式規則格納部14には、音声認
識結果を表示する文字の表示様式を、音声特性情報判別
部13で判別された音声特性に対応して定めた規則が格
納されている。例えば、音声信号獲得部11で獲得され
た音声信号が、テレビ番組に出演する2人の俳優、男優
Aと女優Bである場合に、音声特性情報判別部13で発
話者が男優Aであると判定された場合には表示文字を青
色で表示し、女優Bであると判定された場合には表示文
字を赤色で表示するという規則が格納されている。
【0028】次に、文字画像作成部15について説明す
る。
【0029】文字画像作成部15では、音声特性情報判
別部13から供給された話者認識結果から、文字表示様
式規則格納部14に格納される規則を参照して、表示す
る音声認識結果の文字の色を特定し、音声認識部12か
ら供給される音声認識結果に対応した文字にこの特定さ
れた色を適用することにより、文字画像を作成する。
【0030】文字画像作成部15で作成された文字画像
は、モニタ受像機16に供給され、モニタ受像機16に
て表示される。
【0031】このようにして、本実施の形態において
は、話者認識結果を、音声認識結果を表示する文字の色
に対応させているので、音声認識結果と話者認識結果の
双方を、出力文字表示を通じて同時に伝達することがで
きる。
【0032】なお、本実施の形態では、文字表示様式規
則格納部14に格納される文字表示様式規則が、文字の
色である場合を例に説明したが、文字の大きさ、文字の
フォント、文字の太さ、文字表示する際のモニタ画面上
の位置、複数の文字を表示する際の文字間隔など、その
他の文字表示様式について少なくとも1つの規則を設定
することも同様に実施することが可能である。
【0033】また、本実施の形態では、音声特性情報判
別部13で判別される音声特性が、あらかじめ登録され
たいずれの話者であるかの情報である場合を例に説明し
たが、その他音声信号に含まれる言語情報以外の情報で
ある、話者の属性、音声信号の大きさ、発声速度などを
音声特性情報として、同様に実施することが可能であ
る。
【0034】また、本実施の形態では、音声信号獲得部
11は、マイクロフォン、あるいは、テレビ放送信号か
ら、音声認識ならびに音声特性判定の対象となる音声信
号を抽出する場合を例に説明したが、ラジオ等、他の音
声信号源を利用しても同様に実施することが可能であ
る。
【0035】また、本実施の形態における、音声信号獲
得部11、音声認識部12、音声特性情報判別部13、
文字表示様式規則格納部14、ならびに、文字画像作成
部15は、テレビ受像機内部、あるいは、放送局内のい
ずれに置くことも可能である。
【0036】(実施の形態2)図4は、本発明の実施の
形態2における音声認識文字表示装置の他の実施形態を
示すブロック構成図である。
【0037】本発明の音声認識文字表示装置の他の一実
施例として、図4に示すように、あらかじめ確定された
音声特性情報をテレビ放送信号から音声特性情報獲得部
53で獲得し、この情報を文字画像作成部55での文字
の表示様式の決定に用いるようにしたものである。
【0038】実施の形態1の音声特性情報判定部13に
おける判定結果は、必ずしも正しいとは限らない。した
がって、あらかじめ確定された音声特性情報がテレビ放
送信号などを通じて利用可能な場合には、すでに確定さ
れた音声特性情報を音声特性情報獲得部53で獲得し、
この音声特性情報を文字画像作成部55における文字の
表示様式の決定に利用することにより、より正確な情報
の伝達が可能となる。
【0039】
【発明の効果】以上のように本発明によれば、音声認識
部において、音声信号に含まれる言語情報を認識すると
ともに、あわせて、音声特性情報判別部において、声の
大きさや発声の速度、あるいは、発話者が誰であるのか
といった、音声信号に含まれる言語情報以外の音声特性
情報を判別し、言語情報の出力手段である文字出力時
に、判別された音声特性情報に応じて、文字の大きさ、
色、文字間隔など、文字出力の様式を所定の規則にした
がって文字画像を作成し、これをモニタ受像機により出
力することにより、音声認識結果の出力時に、音声信号
に含まれる言語情報と音声特性情報の双方を、出力文字
表示により同時に伝達でき、モニタを通じて音声認識結
果を確認するユーザが、音声信号に含まれる言語情報と
音声特性情報の双方を迅速かつ簡便に理解できるという
有利な効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声認識文字表
示装置を示すブロック構成図
【図2】図1に示した音声認識部内部の構成を示すブロ
ック構成図
【図3】図1に示す音声特性判定部内部の構成を示すブ
ロック構成図
【図4】本発明の実施の形態2における音声認識文字表
示装置を示すブロック構成図
【図5】従来の技術の実施形態を示すブロック構成図
【符号の説明】
11 音声信号獲得部 12 音声認識部 13 音声特性判定部 14 文字表示様式規則格納部 15 文字画像作成部 16 モニタ受像部 21 A/D変換器 22 音響分析部 23 音響モデル 24 言語モデル 25 尤度算出部 31 A/D変換器 32 音響分析部 33 話者モデル 35 尤度算出部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 17/00 G10L 3/00 545A H04N 5/44 551G 5/445 561C Fターム(参考) 5C025 BA25 CA09 CA10 CA11 CA12 CB10 DA10 5D015 AA06 FF03 HH04 HH21 KK02 LL05 5E501 AC15 BA03 CB15 EA21 FA13 FA14

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を獲得する音声信号獲得部と、
    前記音声信号獲得部から音声信号を供給され、音声信号
    中に含まれる言語情報を判別する音声認識部と、前記音
    声信号獲得部から音声信号を供給され、音声信号中に含
    まれる話者ならびに発声の様態に関する音声特性情報を
    判別する音声特性判別部と、あらかじめ定められた文字
    表示様式規則を格納する文字表示様式規則格納部と、前
    記音声特性判別部から供給される音声特性情報と、前記
    文字表示様式規則格納部に格納される文字表示様式規則
    とに基づき、前記音声認識部から供給される言語情報に
    対応した文字の表示様式を決定し文字画像を作成する文
    字画像作成部と、前記文字画像作成部で作成された文字
    画像を画像出力するモニタ受像部とから構成されること
    を特徴とする音声認識文字表示装置。
  2. 【請求項2】 前記音声信号獲得部は、テレビジョン放
    送の音声信号を獲得し、前記モニタ受像部は、テレビジ
    ョン受像機のモニタ受像部であることを特徴とする請求
    項1記載の音声認識文字表示装置。
  3. 【請求項3】 前記文字表示様式規則格納部に格納され
    る文字表示様式規則は、話者毎に表示文字の色、文字の
    大きさ、文字のフォント、文字の太さ、文字表示する際
    のモニタ画面上の位置の少なくとも1つを変えることを
    特徴とする請求項1記載の音声認識文字表示装置。
  4. 【請求項4】 音声信号を獲得する音声信号獲得部と、
    前記音声特性情報を獲得する音声特性獲得部と、前記音
    声信号獲得部から音声信号を供給され、音声信号中に含
    まれる言語情報を判別する音声認識部と、あらかじめ定
    められた文字の表示様式規則を格納する文字表示様式規
    則格納部と、前記音声特性獲得部で獲得された音声特性
    情報と、前記文字表示様式規則格納部に格納される文字
    表示様式規則とに基づき、前記音声認識部から供給され
    る言語情報に対応した文字の表示様式を特定し文字画像
    を作成する文字画像作成部と、前記文字画像作成部で作
    成された文字画像を画像出力するモニタ受像部とから構
    成されることを特徴とする音声認識文字表示装置。
  5. 【請求項5】 前記音声信号獲得部は、テレビジョン放
    送の音声信号を獲得し、前記モニタ受像部は、テレビジ
    ョン受像機のモニタ受像部であることを特徴とする請求
    項4記載の音声認識文字表示装置。
JP2001148223A 2001-05-17 2001-05-17 音声認識文字表示方法およびその装置 Pending JP2002341890A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001148223A JP2002341890A (ja) 2001-05-17 2001-05-17 音声認識文字表示方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001148223A JP2002341890A (ja) 2001-05-17 2001-05-17 音声認識文字表示方法およびその装置

Publications (1)

Publication Number Publication Date
JP2002341890A true JP2002341890A (ja) 2002-11-29

Family

ID=18993591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001148223A Pending JP2002341890A (ja) 2001-05-17 2001-05-17 音声認識文字表示方法およびその装置

Country Status (1)

Country Link
JP (1) JP2002341890A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006022071A1 (ja) * 2004-08-25 2006-03-02 Matsushita Electric Industrial Co., Ltd. 映像表示装置及び映像表示方法
US9710219B2 (en) 2013-06-10 2017-07-18 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification device, and speaker identification system
JP2019197167A (ja) * 2018-05-10 2019-11-14 日本放送協会 音声特性処理装置、音声認識装置およびプログラム
KR20200074624A (ko) * 2018-12-17 2020-06-25 주식회사 한글과컴퓨터 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006022071A1 (ja) * 2004-08-25 2006-03-02 Matsushita Electric Industrial Co., Ltd. 映像表示装置及び映像表示方法
US9710219B2 (en) 2013-06-10 2017-07-18 Panasonic Intellectual Property Corporation Of America Speaker identification method, speaker identification device, and speaker identification system
JP2019197167A (ja) * 2018-05-10 2019-11-14 日本放送協会 音声特性処理装置、音声認識装置およびプログラム
JP7175101B2 (ja) 2018-05-10 2022-11-18 日本放送協会 音声特性処理装置、音声認識装置およびプログラム
KR20200074624A (ko) * 2018-12-17 2020-06-25 주식회사 한글과컴퓨터 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법
KR102187528B1 (ko) * 2018-12-17 2020-12-07 주식회사 한글과컴퓨터 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
JP3844431B2 (ja) 発話認識に基づいたキャプションシステム
CN109300347B (zh) 一种基于图像识别的听写辅助方法及家教设备
KR101994291B1 (ko) 통합써머리를 제공하는 영상재생장치 및 방법
US7286749B2 (en) Moving image playback apparatus, moving image playback method, and computer program thereof with determining of first voice period which represents a human utterance period and second voice period other than the first voice period
US20100250249A1 (en) Communication control apparatus, communication control method, and computer-readable medium storing a communication control program
JP2008309856A (ja) 音声認識装置及び会議システム
CN110853615B (zh) 一种数据处理方法、装置及存储介质
JP2007264473A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP2011250100A (ja) 画像処理装置および方法、並びにプログラム
CN114157920A (zh) 一种展示手语的播放方法、装置、智能电视及存储介质
US10216732B2 (en) Information presentation method, non-transitory recording medium storing thereon computer program, and information presentation system
CN114121006A (zh) 虚拟角色的形象输出方法、装置、设备以及存储介质
KR20110100649A (ko) 음성을 합성하기 위한 방법 및 장치
CN110992984B (zh) 音频处理方法及装置、存储介质
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP2002341890A (ja) 音声認識文字表示方法およびその装置
JP2008275987A (ja) 音声認識装置および会議システム
KR102433964B1 (ko) 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템
CN117198338A (zh) 一种基于人工智能的对讲机声纹识别方法及系统
KR101920653B1 (ko) 비교음 생성을 통한 어학학습방법 및 어학학습프로그램
CN111182409B (zh) 一种基于智能音箱的屏幕控制方法及智能音箱、存储介质
JP2000206987A (ja) 音声認識装置
JP2016156993A (ja) 情報処理装置、情報処理装置の制御方法、制御プログラム、記録媒体
CN112071301B (zh) 语音合成的处理方法、装置、设备及存储介质
CN116233540B (zh) 基于视频图像识别的并行信号处理方法及系统