JP2000206987A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2000206987A
JP2000206987A JP11006898A JP689899A JP2000206987A JP 2000206987 A JP2000206987 A JP 2000206987A JP 11006898 A JP11006898 A JP 11006898A JP 689899 A JP689899 A JP 689899A JP 2000206987 A JP2000206987 A JP 2000206987A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
channel
input
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11006898A
Other languages
English (en)
Inventor
Hiroaki Momose
裕明 百瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP11006898A priority Critical patent/JP2000206987A/ja
Publication of JP2000206987A publication Critical patent/JP2000206987A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】2カ国語放送を用いてより効率的な語学学習を
する音声認識装置を提供する。 【解決手段】第1CPU1において、記録媒体3に記録
する複数の言語に対応する音声認識情報3aの中から音
声入力端子7に入力される音声信号の言語に対応する音
声認識情報をチャンネル毎に設定し、設定された音声認
識情報を用いてチャンネル毎に音声認識する。一方、第
2CPU2において、音声入力端子7で入力された各チ
ャンネルの音声データから所定長さの無音データを検出
する。そして、第1CPU1で、各チャンネルの音声認
識結果を第2CPU2によって検出される無音データ毎
にそれぞれ対応させて表示装置5に表示させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識装置、詳
しくは、複数の音声を識別する音声認識装置に関する。
【0002】
【従来の技術】従来、テレビ放送等において2つの音声
用チャンネルを用いた2カ国語放送技術は広く知られる
に至っている。この2カ国語放送は、例えば、第1のチ
ャンネル(主音声チャンネル)から日本語、第2のチャ
ンネル(副音声チャンネル)から外国語を出力すること
で実現されている。また、一般に販売されている音声多
重放送対応テレビでは2カ国語放送を聴取する際に、主
音声のみ、副音声のみあるいは主音声と副音声とを同時
に発声させる3つの出力形態を選択することができるよ
うになっている。
【0003】この技術を利用して視聴者は、2カ国語放
送を見る際に副音声のみを聞いて語学の学習に役立てる
ことができる。しかしながら、従来においては主音声と
副音声との両方を同時に聞くか、あるいは何れか一方の
音声のみを聞くことしかできなかった。
【0004】一方、語学学習においては、効率よく学習
するために2カ国語の対応箇所を交互に聞き比べること
が望ましい。これを先の2カ国語放送の場合に当てはめ
ると、主音声あるいは副音声として出力される2カ国語
音声の対応箇所を聞き比べて学習することが望ましい。
しかしながら、現状の2カ国語放送は、原則として主音
声あるいは副音声として出力される音声を同時に放送し
ており、上述したような語学学習には適していなかっ
た。
【0005】このような事情に鑑み本出願人は、先に特
願平9−334301号において、2カ国語放送を利用
して語学学習を行うに適した音声記録再生装置を提案し
ている。この音声記録再生装置によると、2カ国語放送
の音声を記録した後に主音声と副音声とをある対応付け
られた区切り毎に交互に聞くことが可能となり、語学学
習を効率的にすることができる。
【0006】
【発明が解決しようとする課題】上述した本出願人によ
る音声記録再生装置は、語学学習を効率よく行うことが
できる非常に有用な発明であるが、上記装置における語
学学習では音声のみによる学習となるため、例えば音声
から単語が聞き取れなかったり、外国語のスペルを確認
したい場合等に対処するため、さらなる改善が望まれて
いた。
【0007】本発明はかかる事情に鑑みてなされたもの
であり、上記本出願による音声記録再生装置をさらに改
良して、2カ国語放送を用いてより効率的な語学学習を
する音声認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めに本発明の第1の音声認識装置は、音声信号の入力が
可能なチャンネルを複数有する音声入力手段と、複数の
言語に対応する複数の音声認識情報を有する音声認識情
報記憶手段と、上記複数の音声認識情報の中から上記音
声入力手段に入力される音声信号の言語に対応する音声
認識情報をチャンネル毎に設定する設定手段と、上記設
定手段によって設定された音声認識情報を用いてチャン
ネル毎に音声認識する音声認識手段と、上記音声認識手
段による各チャンネルの認識結果をそれぞれ対応させて
表示出力させる制御手段と、を具備したことを特徴とす
る。
【0009】上記の目的を達成するために本発明の第2
の音声認識装置は、音声信号の入力が可能なチャンネル
を複数有する音声入力手段と、複数の言語に対応する複
数の音声認識情報を有する音声認識情報記憶手段と、上
記複数の音声認識情報の中から上記音声入力手段に入力
される音声信号の言語に対応する音声認識情報をチャン
ネル毎に設定する設定手段と、入力された各チャンネル
の音声データから所定長さの無音データを検出する無音
データ検出手段と、上記設定手段によって設定された音
声認識情報を用いてチャンネル毎に音声認識する音声認
識手段と、上記音声認識手段による各チャンネルの認識
結果を上記無音データ検出手段によって検出される無音
データ毎にそれぞれ対応させて表示出力させる制御手段
と、を具備したことを特徴とする。
【0010】上記の目的を達成するために本発明の第3
の音声認識装置は、上記第1または第2の音声認識装置
において、上記設定手段は、各チャンネルに入力された
音声データから言語情報を検出し、該検出された言語情
報に対応する音声認識情報をチャンネル毎に設定するこ
とを特徴とする。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。
【0012】図1は、本発明の第1の実施形態である音
声認識装置の構成を示したブロック図である。
【0013】本第1の実施形態では、音声認識装置とし
てパーソナルコンピュータ等のコンピュータ10を採用
する。このコンピュータ10は音声入力手段として2チ
ャンネルのステレオ音声が入力可能なオーディオ入力端
子7を備えており、テレビ等からの2カ国語放送の音声
出力は、オーディオ用接続コード等を介して該入力端子
に入力されるようになっている。
【0014】なお、コンピュータ10における2カ国語
放送に係る音声の取得形態としては種々想定でき、以
下、例を簡単に説明する。
【0015】標準的な例としては、オーディオ用接続コ
ード等を介して受信機器であるテレビ等とコンピュータ
10とを接続し、該テレビ等からの2カ国語放送をリア
ルタイムに入力する形態が考えられる。あるいは、同じ
くオーディオ用接続コード等で当該コンピュータ10と
ビデオレコーダー等の録音機器とを接続し、記録媒体、
例えばビデオテープに録音した2カ国語放送に係る音声
を該ビデオレコーダーで再生し、これを入力する形態で
も良い。すなわち、2カ国語放送時にリアルタイムに音
声を入力するに限らず、録音された音声を用いることも
できる。
【0016】さらに、音声入力手段としては、先に述べ
たようにオーディオ用接続コードを介する音声入力端子
7に限らず、例えば、着脱式記録媒体用の装着装置を採
用しても良い。この場合、音声を一旦、光磁気ディスク
やフラッシュメモリ等の着脱式の記録媒体に記録してお
き、該記録媒体をコンピュータ10における記録媒体用
の装着装置(音声入力手段)に装着し、同記録媒体上の
音声データを読み込むことで音声を入力する。
【0017】なお、本実施形態においては入力する音声
としてアナログ信号を想定するが、これに限らずデジタ
ルデータを入力する機器においても本発明を適用するこ
とができる。
【0018】このように2カ国語放送に係る音声の取得
形態としては種々想定できるが、本実施形態において
は、何れの形態を採用しても良い。
【0019】図1に示すように、本第1の実施形態の音
声認識装置(コンピュータ10)は、2チャンネルの音
声入力端子7と、各々の音声入力端子からの音声信号を
第2CPU2の制御下にA/D変換するA/D変換機4
と、このA/D変換機4のA/D変換処理を制御すると
共に当該変換されたデジタルデータから所定長さの無音
データを検出する第2CPU2と、入力される音声信号
に係る所定の音声認識情報をチャンネル毎に設定し、設
定された音声認識情報に基づいてチャンネル毎に音声認
識し、この各チャンネルの認識結果を上記無音データ毎
に表示出力させる第1CPU1と、該第1CPU1によ
り認識した結果をいわゆるテキスト形式の文書で表示可
能な表示装置5と、上記入力される音声信号に係る所定
の音声認識情報をチャンネル毎に設定する手段の役目を
果たすと共に当該音声認識装置における必要な操作を行
う操作部6と、複数の言語に対応する複数の音声認識情
報を有する音声認識情報記憶手段である記録媒体3と、
第1CPU1の制御下に入力された音声に係るデータを
記録するメモリ8と、で構成される。
【0020】上述の如く、第1CPU1は、上記音声認
識情報記憶手段(記録媒体3)に記録される複数の音声
認識情報の中から上記音声入力端子7に入力される音声
信号の言語に対応する音声認識情報をチャンネル毎に設
定する設定手段、この設定手段によって設定された音声
認識情報を用いてチャンネル毎に音声認識する音声認識
手段、この音声認識手段による各チャンネルの認識結果
を上記第2CPU2によって検出される無音データ毎に
それぞれ対応させて表示装置5に表示出力させる制御手
段としての役目を果たす。
【0021】また、第2CPU2は、A/D変換機4か
らのデジタルデータに基づいて、所定長さの無音データ
を検出する無音データ(区切れ)検出手段の役目を果た
す。
【0022】さらに、上記記録媒体3には、本発明の音
声認識装置の音声認識処理を行う音声認識プログラム3
bの他、音声認識処理の際に使用される複数の音響モデ
ル、言語モデル等の様々な情報を含んだ音声認識情報3
aが複数記録されている。そして、当該音声認識装置は
上述した音声認識処理プログラム3bによって音声認識
処理を行う。
【0023】上記表示装置5は、本実施形態においては
コンピュータ10のディスプレイで実現され、また、上
記操作部6は同様にキーボードである。
【0024】次に、このように構成される音声認識装置
における音声認識前の処理を説明する。
【0025】まず、音声認識装置である当該コンピュー
タ10の音声入力端子7とテレビ等の音声出力端子とを
接続コードで接続した後、該コンピュータ10の電源を
入れる。コンピュータ10の電源を入れると、第1CP
U1の制御下に表示装置5に主音声と副音声それぞれの
言語を選ぶ画面が現れる。図2にこの選択画面の一例を
示す。
【0026】ここで、例えばキーボード(操作部6)の
カーソルキーによって最初に主音声の言語を選択してリ
ターンキーで決定し、次に同様な操作で副音声の言語を
選択、決定する。なお、ここでは、例えば主音声に日本
語、副音声に米語を選ぶことにする(以下、同様)。
【0027】上記操作を受けて第1CPU1は選択され
た言語に対応した音声認識処理に使用するチャンネル毎
の音声認識情報を設定する。すなわち、記録媒体3に記
録された複数の言語に対応した複数の音声認識情報3a
の中から、主音声用音声認識情報に日本語の、副音声用
音声認識情報には米語の音声認識情報を設定する。
【0028】次に、本実施形態の音声認識装置における
音声認識処理動作について図3、図4を参照して説明す
る。
【0029】図3は、本実施形態の音声認識装置におけ
る一連の処理をブロックで示した説明図である。
【0030】上述したように、表示装置5に表示された
選択画面において音声認識開始の釦を選択、決定する
と、第1CPU1の制御下に音声認識処理が開始され
る。
【0031】上記操作により処理が開始されると、テレ
ビ等から出力された主音声、副音声の音声信号は接続コ
ードを介して音声認識装置の音声入力端子7から入力さ
れる(ブロック11)。入力された音声信号はA/D変
換機4に入力される。このA/D変換機4は、第2CP
U2の制御下に入力した音声をA/D変換する(ブロッ
ク12)。なお、このA/D変換は、直接的には第2C
PU2により制御されるが、この第2CPU2も第1C
PU1より所定の指示を受ける。
【0032】すなわち、当該A/D変換の際には、第1
CPU1が音声認識プログラムにより第2CPU2に所
定のサンプリング周波数で、例えば22.05kHzで
デジタル信号に変換するよう命令する。これにより第2
CPU2は、第1CPU1の指示を受けてA/D変換機
4を22.05kHzのサンプリング周波数でデジタル
信号に変換するように制御し、入力された音声信号は2
2.05kHzのPCMデータに変換される。
【0033】次にデジタル信号に変換された音声データ
は第2CPU2に入力され、区切れ検出処理が行われる
(ブロック13)。この区切れ検出処理では音声データ
の中で句読点等の文の区切れ位置を検出する。
【0034】ここで、第2CPU2による区切れ検出処
理を図4のフローチャートを参照して説明する。
【0035】最初に第2CPU2は、入力された音声中
の有音フレーム数を数えるカウンタの値Mと無音フレー
ム数を数えるカウンタの値Nをリセット(M=0,N=
0)する(ステップS1)。次に第2CPU2に音声デ
ータが入力されると、第2CPU2は音声データをフレ
ーム単位(本実施形態では20msec毎にサンプルさ
れたデータを1フレームとする)に分解する(ステップ
S2)。
【0036】次に入力されたフレーム毎の音声データが
有音フレームか無音フレームかを判定する(ステップS
3)。ここで第2CPU2はフレーム単位で音声のエネ
ルギーレベルを求め、該フレームが所定のレベルより大
きなエネルギーを持てば有音フレーム、所定のレベルと
同等あるいはそれ以下であれば無音フレームと判定す
る。
【0037】このステップS3における判定で無音フレ
ームと判定された場合には、有音フレームのカウンタの
値Mを検出する(ステップS5)。ここで、有音フレー
ムカウンタ値が、例えばM=100以上のとき(本実施
形態においては2秒以上に相当する)は、第2CPU2
は次に無音フレームカウンタ値Nを検索する(ステップ
S6)。
【0038】このステップS6において、無音フレーム
カウンタ値Nが、例えばN=25以上(本実施形態にお
いては0.5秒以上)であるとき、第2CPU2はこの
無音区間を区切れ位置と判断し、第1CPU1に区切れ
位置を示す情報を送信する(ステップS8)と共に有音
フレームカウンタ値M、無音フレームカウンタ値Nを共
にリセット(M=0,N=0)する(ステップS9)。
区切れ位置を示す情報を受けた第1CPU1は、後述す
るように表示位置の変更を行う。
【0039】一方、上記ステップS6において、無音フ
レームカウンタ値Nが25より小さい場合は、第2CP
U2は、無音フレームカウンタ値Nをインクリメント
(N=N+1)する(ステップS7)。
【0040】また、上記ステップS5において、入力さ
れたフレームが無音フレームでかつ有音フレームカウン
タ値Mが100未満の場合、有音フレームカウンタ値M
をインクリメント(M=M+1)する(ステップS
4)。
【0041】また、上記ステップS3において、入力さ
れたフレームが有音フレームである場合においても、有
音フレームカウンタ値Mをインクリメント(M=M+
1)する(ステップS4)。
【0042】上記ステップS4、ステップS7またはス
テップS9の後、音声データ(フレーム)は第2CPU
2から第1CPU1に出力され(ステップS10)、さ
らに第1CPU1の制御下に一旦メモリ8に入力された
後、音声認識処理(図3:ブロック15参照)される。
なお、上述した処理は音声認識処理が終了するまで実行
される(ステップS11)。
【0043】図3に戻って、この音声認識処理(ブロッ
ク15)に先立ち第1CPU1において、音声信号の分
析、例えば線形予測係数やケプストラム係数、所定の周
波数帯域毎のパワー、ゼロクロス数などの音声の特徴量
を抽出する処理がなされる(ブロック14)。
【0044】この分析処理の後、実際に第1CPU1に
おいて音声認識処理がなされる(ブロック15)。この
処理においては、例えば、上述したように主音声には日
本語の音声認識情報(ブロック17)、副音声には米語
の音声認識情報(ブロック18)を用いて音声認識処理
を行う。
【0045】まず、チャンネル毎に上述した記録媒体3
に記録された音声認識情報19(図1における音声認識
情報3aと同等)内の音響モデル(図3においては、日
本語用音声認識情報20における日本語用音響モデル2
0a)の標準パターンと、入力された音声の音声分析
(ブロック14)によって得られた特徴量とのパターン
とを比較して発生確率を計算して単語の尤度付けを行
う。
【0046】さらに言語モデル(図3においては、日本
語用音声認識情報20における日本語用言語モデル20
b)、例えばtri−gramモデルを用いて認識する
単語とその前後の単語の関係から単語の発声確率を計算
して尤度を求め、先に計算したパターン比較での尤度と
の総合で尤も尤度の大きな単語を認識結果として出力す
る。
【0047】また、上記音声認識処理において第1CP
U1は第2CPU2から区切れ情報が送信された場合、
音声認識処理によって得た音声認識結果の表示位置を変
更する。図5にその一表示例を示す。
【0048】例えば、初めに図5において“1”の位置
に副音声の音声認識結果を表示させていたとする(Afte
r 18 years...)。ここで、第2CPU2において区切
れ検出処理で区切れが検出され、第1CPU1に区切れ
位置であるという情報が送信されると該第1CPU1の
制御により、それ以後の音声認識結果は“2”の位置に
表示されるようになる(the British Labor Part
y...)。このようにして以下同様の処理(“3”…)が
行われる。
【0049】主音声の認識結果の表示も同様に行われ、
最初に“A”の位置に認識結果を表示し(18年の野党
暮らしの後、)、区切れ情報が送信されると、“B”の
位置に表示する(英国では労働党が…)ように切り替え
られ、以下同様の処理(“C”…)が行われる。また、
これら処理は主音声、副音声同時に並列して行われる。
【0050】なお、本実施形態では、図5のように表示
を行ったが、表示(出力)例としては、例えば主音声の
認識結果と副音声の認識結果を左右に並べたり、上述し
た位置と左右を反転させたり、学習しやすいように見や
すくしたり、その他区切れ毎に対応させて表示させるの
であれば如何なる表示であっても良い。
【0051】さらに、ディスプレイ(表示装置5)に表
示された音声認識結果は図示しないプリンタ等によって
印刷し、語学学習テキストして使用することも可能であ
る。また、音声認識処理は所定の操作、例えばキーボー
ドのストップ釦を押すことにより終了できる。
【0052】以上説明したように、この第1の実施形態
に係る音声認識装置によれば、2カ国語放送を用いて効
率的な語学学習を行うことができる。
【0053】次に、本発明の第2の実施形態について説
明する。この第2の実施形態である音声認識装置は、そ
の構成は、ブロックで示す限り図1と同様の構成をなす
が、上記設定手段(第1CPU1、操作部6)による音
声認識情報設定を自動化処理することを特徴とする。な
お、上記第1の実施形態と同様な構成要素については、
重複を避けるため、ここでの詳しい説明は省略する。.
現在、我が国における2カ国語放送は、いわゆるアナ
ログ放送を採用しているため、音声もアナログ信号であ
る。しかし、今後実施されると見込まれるデジタル放送
においては、映像、音声ともにデジタル信号となるため
デジタルデータでの情報のやり取りが可能となる。
【0054】さらに、デジタル信号は送信する際に、音
声や映像のデータだけでなく、放送日時や、放送時間等
の様々な付加情報の送信が可能となり他のデジタル機器
でその情報を検索、取得することが可能である。
【0055】本第2の実施形態に係る音声認識装置は、
デジタルデータによる2カ国語放送を利用した場合を想
定している。
【0056】このデジタルデータ入力に対応して、本実
施形態においては、音声入力手段としてデジタルデータ
を入力可能とする音声入力端子を採用する。このとき、
該音声デジタルデータには、番組のヘッダー情報として
放送時間や放送日時などの他、言語情報、例えば、主音
声が日本語で副音声が米語であれば、その情報が書かれ
ているものとする。
【0057】その他の構成は、ブロックで示す限りにお
いて図1に示す上記第1の実施形態と同様である。
【0058】このように構成される本第2の実施形態の
音声認識装置において、デジタル音声データが入力され
ると、当該音声認識装置は、音声データが入力された際
に最初に第2CPU2が該ヘッダー情報中の、主音声と
副音声の言語情報を検出し、その情報を第1CPU1に
送信する。該情報を受け取った第1CPU1は記録媒体
3に記録されている複数の音声認識情報3aの中から送
られてきた言語情報に対応する音声認識情報を音声認識
に使用する主音声用音声認識情報、副音声用音声認識情
報にそれぞれ設定する。以降の処理は上述した第1の実
施形態と同様の処理が行われる。
【0059】この処理により、自動的に入力されたチャ
ンネル毎の音声に対応した音声認識情報を設定すること
が可能となる。
【0060】以上説明したように、本第2の実施形態に
係る音声認識装置によれば、上記第1の実施形態におけ
る効果に加えて、入力された音声に対応した音声認識情
報が自動的に設定される。
【0061】
【発明の効果】以上説明したように本発明によれば、2
カ国語放送を用いてより効率的な語学学習をする音声認
識装置を提供できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態である音声認識装置の
構成を示したブロック図である。
【図2】第1の実施形態の音声認識装置において、主音
声および副音声それぞれの言語を選ぶ選択画面の一例を
示した図である。
【図3】第1の実施形態の音声認識装置における一連の
処理をブロックで示した説明図である。
【図4】第1の実施形態の音声認識装置における第2C
PUによる区切れ検出処理を示したフローチャートであ
る。
【図5】第1の実施形態の音声認識装置において、区切
れ情報に基づく音声認識結果の一表示例を示した図であ
る。
【符号の説明】
1…第1CPU 2…第2CPU 3…記録媒体 3a…音声認識情報 3b…音声認識処理プログラム 4…A/D変換機 5…表示装置 6…操作部 7…音声入力端子 8…メモリ 10…コンピュータ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G09B 19/06

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 音声信号の入力が可能なチャンネルを複
    数有する音声入力手段と、 複数の言語に対応する複数の音声認識情報を有する音声
    認識情報記憶手段と、 上記複数の音声認識情報の中から上記音声入力手段に入
    力される音声信号の言語に対応する音声認識情報をチャ
    ンネル毎に設定する設定手段と、 上記設定手段によって設定された音声認識情報を用いて
    チャンネル毎に音声認識する音声認識手段と、 上記音声認識手段による各チャンネルの認識結果をそれ
    ぞれ対応させて表示出力させる制御手段と、 を具備したことを特徴とする音声認識装置。
  2. 【請求項2】 音声信号の入力が可能なチャンネルを複
    数有する音声入力手段と、 複数の言語に対応する複数の音声認識情報を有する音声
    認識情報記憶手段と、 上記複数の音声認識情報の中から上記音声入力手段に入
    力される音声信号の言語に対応する音声認識情報をチャ
    ンネル毎に設定する設定手段と、 入力された各チャンネルの音声データから所定長さの無
    音データを検出する無音データ検出手段と、 上記設定手段によって設定された音声認識情報を用いて
    チャンネル毎に音声認識する音声認識手段と、 上記音声認識手段による各チャンネルの認識結果を上記
    無音データ検出手段によって検出される無音データ毎に
    それぞれ対応させて表示出力させる制御手段と、 を具備したことを特徴とする音声認識装置。
  3. 【請求項3】 上記設定手段は、各チャンネルに入力さ
    れた音声データから言語情報を検出し、該検出された言
    語情報に対応する音声認識情報をチャンネル毎に設定す
    ることを特徴とする請求項1または2に記載の音声認識
    装置。
JP11006898A 1999-01-13 1999-01-13 音声認識装置 Withdrawn JP2000206987A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11006898A JP2000206987A (ja) 1999-01-13 1999-01-13 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11006898A JP2000206987A (ja) 1999-01-13 1999-01-13 音声認識装置

Publications (1)

Publication Number Publication Date
JP2000206987A true JP2000206987A (ja) 2000-07-28

Family

ID=11651055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11006898A Withdrawn JP2000206987A (ja) 1999-01-13 1999-01-13 音声認識装置

Country Status (1)

Country Link
JP (1) JP2000206987A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373392A (ja) * 2001-06-13 2002-12-26 Takamisawa Cybernetics Co Ltd データ変換装置及びテレメータ装置
GB2399478A (en) * 2003-03-12 2004-09-15 Hewlett Packard Development Co Deriving ancillary data from primary media data, directing the primary data to a primary device and the ancillary data to an ancillary device
JP2004362280A (ja) * 2003-06-05 2004-12-24 Hitachi Ltd 放送番組蓄積装置
JP2006507530A (ja) * 2002-11-22 2006-03-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識装置及び方法
WO2017035845A1 (zh) * 2015-09-06 2017-03-09 何兰 根据语音调取频道编组的方法和遥控系统
CN108305628A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备和存储介质
JP2018155779A (ja) * 2017-03-15 2018-10-04 ヤマハ株式会社 情報提供方法および情報提供システム
CN110399315A (zh) * 2019-06-05 2019-11-01 北京梧桐车联科技有限责任公司 一种语音播报的处理方法、装置、终端设备及存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373392A (ja) * 2001-06-13 2002-12-26 Takamisawa Cybernetics Co Ltd データ変換装置及びテレメータ装置
JP2006507530A (ja) * 2002-11-22 2006-03-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識装置及び方法
GB2399478A (en) * 2003-03-12 2004-09-15 Hewlett Packard Development Co Deriving ancillary data from primary media data, directing the primary data to a primary device and the ancillary data to an ancillary device
GB2399478B (en) * 2003-03-12 2007-01-31 Hewlett Packard Development Co Media control system and method
JP2004362280A (ja) * 2003-06-05 2004-12-24 Hitachi Ltd 放送番組蓄積装置
WO2017035845A1 (zh) * 2015-09-06 2017-03-09 何兰 根据语音调取频道编组的方法和遥控系统
JP2018155779A (ja) * 2017-03-15 2018-10-04 ヤマハ株式会社 情報提供方法および情報提供システム
CN108305628A (zh) * 2017-06-27 2018-07-20 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备和存储介质
CN108305628B (zh) * 2017-06-27 2020-10-02 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备和存储介质
CN110399315A (zh) * 2019-06-05 2019-11-01 北京梧桐车联科技有限责任公司 一种语音播报的处理方法、装置、终端设备及存储介质
CN110399315B (zh) * 2019-06-05 2021-06-08 北京梧桐车联科技有限责任公司 一种语音播报的处理方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CA2001164C (en) Text-processing system
US6324507B1 (en) Speech recognition enrollment for non-readers and displayless devices
JP5750380B2 (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP2008309856A (ja) 音声認識装置及び会議システム
JP2006301223A (ja) 音声認識システム及び音声認識プログラム
US20090197224A1 (en) Language Learning Apparatus, Language Learning Aiding Method, Program, and Recording Medium
JP2000207170A (ja) 情報処理装置および情報処理方法
JP2000206987A (ja) 音声認識装置
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
KR101920653B1 (ko) 비교음 생성을 통한 어학학습방법 및 어학학습프로그램
JP2016186646A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP2015187738A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP7288530B1 (ja) システムおよびプログラム
JP2001331092A (ja) 語学学習システム
JP2002175095A (ja) 発音学習システム
JP3201327B2 (ja) 録音再生装置
JP2000206985A (ja) 音声認識装置
JP2002259373A (ja) 辞書装置
JPH11143496A (ja) 音声録音再生装置
JPS6129879A (ja) 発音練習機
JP2647872B2 (ja) 文章作成システム
JP2022048516A (ja) 情報処理装置、プログラム、および情報処理方法
JP2647873B2 (ja) 文章作成システム
JPH07295465A (ja) 語学学習装置
JP2003280670A (ja) データ作成装置およびデータ作成方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060404