JP2001166785A - 音声対話コーパスの作成装置及び方法 - Google Patents

音声対話コーパスの作成装置及び方法

Info

Publication number
JP2001166785A
JP2001166785A JP35122599A JP35122599A JP2001166785A JP 2001166785 A JP2001166785 A JP 2001166785A JP 35122599 A JP35122599 A JP 35122599A JP 35122599 A JP35122599 A JP 35122599A JP 2001166785 A JP2001166785 A JP 2001166785A
Authority
JP
Japan
Prior art keywords
dialogue
voice
data
speaker
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP35122599A
Other languages
English (en)
Inventor
Kenji Yamamoto
健司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP35122599A priority Critical patent/JP2001166785A/ja
Publication of JP2001166785A publication Critical patent/JP2001166785A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複雑な記述方法を用いることなく、容易に音
声対話コーパスを作成することができる音声対話コーパ
ス作成装置及び方法を提供する。 【解決手段】 事前に登録されている対話例を示すスク
リプトに基づいて発話テキストを順次出力し、対話履歴
を対話ログデータとして登録する対話ログデータベース
にも同時に登録し、出力された発話テキストの内容を発
話者に伝達し、発話者が自分の音声を音声データとして
入力し、入力された音声データを記録しておき、音声デ
ータの記録が完了した後に、操作者が記録されている発
話者の音声データに基づいて、対話ログデータベースの
発話者の対話部分を書き起こす。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声対話研究の基
礎的データとして共通利用可能な各種・大量の音声デー
タを集積した音声対話コーパスの作成装置及び方法に関
する。
【0002】
【従来の技術】音声に関する研究を進めるためには音声
データが必要不可欠である。かかる音声データは性別や
年齢、方言、人数等に応じて多種多様であり、用意すべ
きデータ量も大量に必要とされる。
【0003】音声コーパスとは、このような大量の音声
データを収録し、保管することで共通利用可能とした音
声データの集積自体を意味している。そして、音声対話
をコーパス化したものを、特に音声対話コーパスと呼ん
でいる。
【0004】音声対話コーパスは、シナリオに沿った模
擬的な対話から収録したものもあれば、シナリオの存在
しない実際の対話音声を収録したものも存在する。それ
ぞれの音声対話データは、対話音声をデジタル化した音
声ファイル、及び対話音声の情報をテキストによって書
き起こしたファイル、さらに説明のためのドキュメント
ファイルとで構成されている。
【0005】
【発明が解決しようとする課題】しかしながら、かかる
音声対話コーパスにおいて、音声対話データからテキス
トデータを書き起こすことは、書き起こしテキストから
容易に元の音声を再生するためのツールとの連携を取る
必要性も高く、一般に作業が容易ではないという問題点
があった。
【0006】特に単なるディクテーションでは、音声の
韻律や調子等の細やかな特徴を表現することもできず、
発話のタイミング等を表現することも困難であることか
ら、対話特有のいわゆる「間」等を表現することも困難
である。かかる観点に立った詳細な表現力を有するコー
パス記述法も多々考案されているが、このような表現で
は一般に複雑になりやすく、作業に多くの時間を要する
という問題も生じている。
【0007】本発明は、上記問題点を解消すべく、複雑
な記述方法を用いることなく、簡易に音声対話コーパス
を作成することができる音声対話コーパス作成装置及び
方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上記目的を達成するため
に本発明にかかる音声対話コーパス作成装置は、対話履
歴を対話ログデータとして登録する対話ログデータベー
スと、事前に登録されている対話例を示すスクリプトに
基づいて発話テキストを順次出力し、対話ログデータベ
ースにも同時に登録するスクリプト実行部と、スクリプ
ト実行部で出力された発話テキストの内容を発話者に伝
達する発話内容伝達部と、発話者が自分の音声を音声デ
ータとして入力する音声入力部と、入力された音声デー
タを記録する音声記録部とを含み、音声データの記録が
完了した後に、操作者が音声記録部に記録されている発
話者の音声データに基づいて、対話ログデータベースの
発話者の対話部分を書き起こすことを特徴とする。
【0009】かかる構成により、従来のように全ての音
声データについて書き起こす必要がないことから、音声
対話コーパス作成時間の短縮を図ることができ、その分
だけ多くの対話コーパスを作成できることから、インタ
フェースの性能向上に貢献することが可能となる。
【0010】また、本発明にかかる音声対話コーパス作
成装置は、音声データの記録時刻を計測する時刻計測部
をさらに含み、音声データの開始時刻と終了時刻を測定
することが好ましい。合成音声の出力開始時刻と出力終
了時刻、あるいは発話者の発話開始時刻と発話終了時刻
を記録することができ、一般に操作者による書き起こし
作業が困難となる要因の一つである音声合成と発話者に
よる発話との重ね合わせ部分を正確に検出することがで
きることから、より精度の高い書き起こし作業を行うこ
とが可能となるからである。
【0011】また、本発明にかかる音声対話コーパス作
成装置は、音声データの存在する区間を検出する音声区
間検出部をさらに含み、音声データの存在する区間を確
定することが好ましい。発話者の発話開始時刻と発話終
了時刻を記録することができ、音声合成と発話者による
発話との重ね合わせ部分を正確に検出することができる
ことから、より精度の高い書き起こし作業を行うことが
可能となるからである。
【0012】また、本発明は、上記のような音声対話コ
ーパス作成装置の機能をコンピュータの処理ステップと
して実行するソフトウェアを特徴とするものであり、具
体的には、事前に登録されている対話例を示すスクリプ
トに基づいて発話テキストを順次出力し、対話履歴を対
話ログデータとして登録する対話ログデータベースにも
同時に登録する工程と、出力された発話テキストの内容
を発話者に伝達する工程と、発話者が自分の音声を音声
データとして入力する工程と、入力された音声データを
記録する工程とを含み、音声データの記録が完了した後
に、操作者が記録されている発話者の音声データに基づ
いて、対話ログデータベースの発話者の対話部分を書き
起こす方法並びにそのような工程をプログラムとして記
録したコンピュータ読み取り可能な記録媒体であること
を特徴とする。
【0013】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、従来のように
全ての音声データについて書き起こす必要がないことか
ら、音声対話コーパス作成時間の短縮を図ることがで
き、その分だけ多くの対話コーパスを作成できることか
ら、インタフェースの性能向上に貢献することが可能な
音声対話コーパス作成装置を実現することが可能とな
る。
【0014】
【発明の実施の形態】以下、本発明の実施の形態にかか
る音声対話コーパス作成装置について、図面を参照しな
がら説明する。図1は本発明の実施の形態にかかる音声
対話コーパス作成装置の構成図である。図1において、
11は操作者が音声データに基づいて対話コーパスを書
き起こす等の操作を行う操作部を、12は事前に登録さ
れている会話例等の振る舞いを示すスクリプトを選択す
る振る舞いスクリプト選択部を、それぞれ示す。
【0015】また、13は選択された振る舞いスクリプ
トに基づいて発話テキストを順次出力する振る舞いスク
リプト実行部を示し、振る舞いスクリプト実行部13に
おいては発話テキスト出力と同時に後述する対話ログデ
ータベース19にも対話ログデータとして登録する。こ
の際、対話ログデータには、発話テキスト自体に加え
て、発話者や状態遷移を示す識別子等もヘッダとして付
加して登録される。
【0016】さらに、14は振る舞いスクリプト実行部
13で出力された発話テキストを音声合成して音声デー
タとして出力する音声合成・出力部を、15は発話者が
自分の音声を音声データとして入力するマイクロフォン
等の音声入力部を、16は入出力された音声データを記
録する音声データ記録部を、17は振る舞いスクリプト
を登録しておく振る舞いスクリプトデータベースを、1
8は対話に関する音声データを記録する対話音声データ
ベースを、19は対話履歴を対話ログデータとして登録
する対話ログデータベースを、それぞれ示す。
【0017】従来は、操作者は操作部11において、音
声データ記録部16によって対話音声データベース18
に記録されている発話者の入力した音声データに基づい
て、当該音声データをテキストデータに書き起こして音
声対話コーパスを作成していた。かかる作業には多くの
時間を要するが、特に人間対人間の対話においては、話
の流れを事前に予測することが一般に困難であることか
ら、全文書き起こしを行うことは避けがたく、作業時間
の短縮は困難であった。
【0018】しかし、例えばカーナビゲーションシステ
ムと対話を行う場合のような人間対機械の対話において
は、少なくとも機械が発する会話の内容及び対話の進め
方については制御することが可能であり、機械が発する
会話の内容については書き起こしを行う必要がない。
【0019】この点に着目して、本実施の形態1におい
ては、振る舞いスクリプト選択部12において、振る舞
いスクリプトデータベース17に事前に登録されている
会話例を一つの会話モデルとして選択する。そして、選
択された振る舞いスクリプトにしたがって、振る舞いス
クリプト実行部13において順次発話テキストを出力す
る。
【0020】同時に、出力する発話テキストの内容を対
話ログデータとして対話ログデータベース19にも登録
する。対話ログデータベース19を照会することで、書
き起こしを行う必要のない部分を特定するためである。
【0021】当該出力された発話テキストは、音声合成
・出力部14において音声合成され、機械が発する合成
音声として出力される。発話者はかかる合成音声を耳か
ら聞くことで、それに対する応答をマイクロフォン等の
音声入力媒体を通じて音声入力部15から入力する。な
お、機械が発生する音声は、音声として出力することな
く、例えばディスプレイ等の表示装置による表示のみで
も良く、発話者に内容を提示できる手段で有れば何でも
良い。
【0022】音声合成・出力部14で合成された音声デ
ータ及び音声入力部15から入力された音声データは、
音声データ記録部16で記録され、対話音声データベー
ス18に保存される。そして、操作部11で対話音声デ
ータベース18に保存された当該音声データに基づい
て、対話ログデータベース19に登録されている対話ロ
グデータにおける発話者の空欄部分に、発話者が話した
内容を操作者がテキストデータとして書き起こす。
【0023】この際、機械が発した会話部分、すなわち
音声合成による部分については、対話ログデータとして
対話ログデータベース19に書き込まれているので、操
作者が改めてテキストデータに書き起こす必要が無く、
実際に書き起こす必要があるのは発話者が入力した音声
データ部分のみとなる。
【0024】したがって、従来のように全ての音声デー
タについて書き起こす必要がないことから、音声対話コ
ーパス作成時間の短縮を図ることができ、その分だけ多
くの対話コーパスを作成できることから、インタフェー
スの性能向上に貢献することが可能となる。
【0025】また、発話者が音声入力部15から入力す
る内容についても、あらかじめ振る舞いスクリプトデー
タベース17に登録されている会話例に基づいた内容と
なることから、ある程度の予想が可能である。例えば、
希望する料理のジャンルを答えている場合に、「ようし
ょく」という音声データを書き起こすのであれば「洋
食」と一義的に定まるものであり、決して「養殖」とは
書き起こされない。したがって、書き起こし作業自体の
精度も高くなることが期待される。
【0026】また、発話者の音声入力内容を音声認識し
て対話ログデータベース19に書き込んでおけば、書き
起こし作業は音声認識の誤っている部分についてのみ行
えば良いことになり、一層の作業効率化を図ることがで
きる。例えば、図2に示すようにディクテーション実行
部21を設けて発話者の音声入力内容を直接対話ログデ
ータベース19に登録しておくことで実現することがで
きる。
【0027】さらに、図3に示すように、時刻計測部3
1を加えることで、合成音声の出力開始時刻と出力終了
時刻、あるいは発話者の発話開始時刻と発話終了時刻を
音声データ記録部16に同時に記録することができ、一
般に操作者による書き起こし作業が困難となる要因の一
つである音声合成と発話者による発話との重ね合わせ部
分を正確に検出することができ、より精度の高い書き起
こし作業を行うことが可能となる。
【0028】また、図4に示すように、音声区間検出部
41を設けることによっても、発話者の発話開始時刻と
発話終了時刻を音声データ記録部16に同時に記録する
ことができることから、音声合成と発話者による発話と
の重ね合わせ部分を正確に検出することができ、より精
度の高い書き起こし作業を行うことが可能となる。
【0029】振る舞いスクリプトデータベース17に登
録されている会話例としてのスクリプトについて、さら
に具体的に説明する。図5は、条件に合致したホテル予
約システムにおける登録スクリプトの例示図である。
【0030】図5において、「SYSTEM」は事前に
登録されているスクリプトから音声合成によって音声出
力される部分を示し。「USER」は発話者が音声入力
すべき項目を示している。図5では、「USER」の部
分にかっこ書きで主題の項目のみが表示されているが、
これはかっこ書きの内容が発話者による入力を期待して
いる内容の主題であることを示している。したがって、
かかる主題に沿わない音声入力がなされると、操作者に
よって理解不能であるとして再入力を促すメッセージを
出力する。
【0031】主題に沿った入力が行われると、合成音声
と音声入力データが音声データ記録部16に記録される
ので、操作者が図6に示すように会話内容を書き起こ
し、対話コーパスを作成する。図6は、音声対話コーパ
スの作成例示図である。この際、音声データに基づいて
単純にディクテーションを行うだけでは、同音異義語等
について誤った書き起こしを行う確率が高くなるが、ス
クリプトに基づいた会話内容であることから会話の内容
が限定されており、より精度良く書き起こしを行うこと
が可能となる。
【0032】また、実際の振る舞いスクリプトの構造は
図7に示すような構造となる。図7(a)は振る舞いス
クリプトの登録内容を、図7(b)は登録されている振
る舞いスクリプトに対応した状態遷移図を示している。
【0033】振る舞いスクリプトは、発話内容だけでは
なく、会話の流れに応じた状態遷移を示す識別子も有し
ている。すなわち図7(b)のような会話例が用意され
ている場合に、数字がそれぞれの発話タイミングを示し
ており、例えば発話タイミング1と2の間では発話者が
処理の種類を入力するとされている場合には、図7
(a)に示すように、振る舞いスクリプトにおける発話
者の発話内容の前に当該発話タイミングでの内容である
ことを示す識別子(1,2)が添付されることとなる。
【0034】また、図8に示すように、振る舞いを行う
主体、すなわち発話者を示すデータを付加することも考
えられる。図7(b)に用意されているような会話例の
場合に、図8では「対話者A」と「対話者B」の発話で
あることを示すデータが追加されている。発話タイミン
グに発話者を追加することで、作成された音声対話コー
パスの検証時に、音声合成部分、すなわち機械による発
話部分についての検証を容易に省略することが可能とな
る。
【0035】以上のように本実施の形態によれば、従来
のように全ての音声データについて書き起こす必要がな
いことから、音声対話コーパス作成時間の短縮を図るこ
とができ、その分だけ多くの対話コーパスを作成できる
ことから、インタフェースの性能向上に貢献することが
可能となる。
【0036】次に、本発明の実施の形態にかかる音声対
話コーパス作成装置を実現するプログラムの処理の流れ
について説明する。図9に本発明の実施の形態にかかる
音声対話コーパス作成装置を実現するプログラムの処理
の流れ図を示す。
【0037】まず、事前に登録されている会話例を示す
振る舞いスクリプトを選択し(ステップS91)、選択
した振る舞いスクリプトを実行する(ステップS9
2)。
【0038】実行する際には、選択した振る舞いスクリ
プトに従って、対話ログデータとして対話ログデータベ
ース19に登録するとともに(ステップS93)、順次
会話文を音声合成して、音声あるいは画面表示等を通じ
て発話者へ内容を提示する(ステップS94)。発話者
は、かかる音声あるいは画面表示等により提示された会
話に対して、適当な回答を音声入力するとともに(ステ
ップS95)、入力された音声は対話音声データベース
へ登録される(ステップS96)。
【0039】発話者によって入力された内容が、振る舞
いスクリプトによって指定されている回答の主題に沿っ
た内容でなければ(ステップS97:No)、再度音声
入力を促すよう音声あるいは画面表示等によって発話者
に提示する(ステップS98)。なお、ここで再入力を
促す振る舞いスクリプトを実行できるようにしても良
い。
【0040】発話者によって入力された内容が、振る舞
いスクリプトによって指定されている回答の主題に沿っ
た内容であれば(ステップS97:Yes)、次の会話
文へと進める(ステップS99)。振る舞いスクリプト
のすべての会話文が終了した時点で処理を終了する(ス
テップS100)。
【0041】また、本発明の実施の形態にかかる音声対
話コーパス作成装置を実現するプログラムを記憶した記
録媒体は、図10に示す記録媒体の例に示すように、C
D−ROM102−1やフロッピディスク102−2等
の可搬型記録媒体102だけでなく、通信回線の先に備
えられた他の記憶装置101や、コンピュータ103の
ハードディスクやRAM等の記録媒体104のいずれで
も良く、プログラム実行時には、プログラムはローディ
ングされ、主メモリ上で実行される。
【0042】さらに、本発明の実施の形態にかかる音声
対話コーパス作成装置により生成された会話スクリプト
データ等を記録した記録媒体も、図10に示す記録媒体
の例に示すように、CD−ROM102−1やフロッピ
ディスク102−2等の可搬型記録媒体102だけでな
く、通信回線の先に備えられた他の記憶装置101や、
コンピュータ103のハードディスクやRAM等の記録
媒体104のいずれでも良く、例えば本発明にかかる音
声対話コーパス作成装置を利用する際にコンピュータ1
03により読み取られる。
【0043】
【発明の効果】以上のように本発明にかかる音声対話コ
ーパス作成装置によれば、従来のように全ての音声デー
タについて書き起こす必要がないことから、音声対話コ
ーパス作成時間の短縮を図ることができ、その分だけ多
くの対話コーパスを作成できることから、インタフェー
スの性能向上に貢献することが可能となる。
【図面の簡単な説明】
【図1】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置の構成図
【図2】 本発明の一実施例にかかる音声対話コーパス
作成装置の構成図
【図3】 本発明の一実施例にかかる音声対話コーパス
作成装置の構成図
【図4】 本発明の他の実施例にかかる音声対話コーパ
ス作成装置の構成図
【図5】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置における振る舞いスクリプトの例示図
【図6】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置において作成された音声対話コーパスの例示
【図7】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置における振る舞いスクリプトのデータ構成例
を示す図
【図8】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置における振る舞いスクリプトのデータ構成例
を示す図
【図9】 本発明の実施の形態にかかる音声対話コーパ
ス作成装置における処理の流れ図
【図10】 記録媒体の例示図
【符号の説明】
11 操作部 12 振る舞いスクリプト選択部 13 振る舞いスクリプト実行部 14 音声合成・出力部 15 音声入力部 16 音声データ記録部 17 振る舞いスクリプトデータベース 18 対話音声データベース 19 対話ログデータベース 21 ディクテーション実行部 31 時刻計測部 41 音声区間検出部 101 回線先の記憶装置 102 CD−ROMやフロッピーディスク等の可搬型
記録媒体 102−1 CD−ROM 102−2 フロッピーディスク 103 コンピュータ 104 コンピュータ上のRAM/ハードディスク等の
記録媒体

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 対話履歴を対話ログデータとして登録す
    る対話ログデータベースと、 事前に登録されている対話例を示すスクリプトに基づい
    て発話テキストを順次出力し、前記対話ログデータベー
    スにも同時に登録するスクリプト実行部と、 前記スクリプト実行部で出力された前記発話テキストの
    内容を発話者に伝達する発話内容伝達部と、 前記発話者が自分の音声を音声データとして入力する音
    声入力部と、 入力された前記音声データを記録する音声記録部とを含
    み、 前記音声データの記録が完了した後に、操作者が前記音
    声記録部に記録されている前記発話者の前記音声データ
    に基づいて、前記対話ログデータベースの前記発話者の
    対話部分をテキストに書き起こすことを特徴とする音声
    対話コーパスの作成装置。
  2. 【請求項2】 音声データの記録時刻を計測する時刻計
    測部をさらに含み、 前記音声データの開始時刻と終了時刻を測定する請求項
    1記載の音声対話コーパスの作成装置。
  3. 【請求項3】 音声データの存在する区間を検出する音
    声区間検出部をさらに含み、 前記音声データの存在する区間を確定する請求項1記載
    の音声対話コーパスの作成装置。
  4. 【請求項4】 事前に登録されている対話例を示すスク
    リプトに基づいて発話テキストを順次出力し、対話履歴
    を対話ログデータとして登録する対話ログデータベース
    にも同時に登録する工程と、 出力された前記発話テキストの内容を発話者に伝達する
    工程と、 前記発話者が自分の音声を音声データとして入力する工
    程と、 入力された前記音声データを記録する工程とを含み、 前記音声データの記録が完了した後に、操作者が記録さ
    れている前記発話者の前記音声データに基づいて、前記
    対話ログデータベースの前記発話者の対話部分を書き起
    こすことを特徴とする音声対話コーパスの作成方法。
  5. 【請求項5】 事前に登録されている対話例を示すスク
    リプトに基づいて発話テキストを順次出力し、対話履歴
    を対話ログデータとして登録する対話ログデータベース
    にも同時に登録するステップと、 出力された前記発話テキストの内容を発話者に伝達する
    ステップと、 前記発話者が自分の音声を音声データとして入力するス
    テップと、 入力された前記音声データを記録するステップとを含
    み、 前記音声データの記録が完了した後に、操作者が記録さ
    れている前記発話者の前記音声データに基づいて、前記
    対話ログデータベースの前記発話者の対話部分を書き起
    こすことを特徴とするコンピュータに実行させるプログ
    ラムを記録したコンピュータ読み取り可能な記録媒体。
JP35122599A 1999-12-10 1999-12-10 音声対話コーパスの作成装置及び方法 Pending JP2001166785A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35122599A JP2001166785A (ja) 1999-12-10 1999-12-10 音声対話コーパスの作成装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35122599A JP2001166785A (ja) 1999-12-10 1999-12-10 音声対話コーパスの作成装置及び方法

Publications (1)

Publication Number Publication Date
JP2001166785A true JP2001166785A (ja) 2001-06-22

Family

ID=18415903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35122599A Pending JP2001166785A (ja) 1999-12-10 1999-12-10 音声対話コーパスの作成装置及び方法

Country Status (1)

Country Link
JP (1) JP2001166785A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062749A (ja) * 2015-09-25 2017-03-30 株式会社アニモ 情報処理方法及び装置
JP2017167367A (ja) * 2016-03-16 2017-09-21 株式会社東芝 対話コーパス収集装置、方法、及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03141463A (ja) * 1989-10-27 1991-06-17 Fujitsu Ltd コメント入力支援方式
JPH07282081A (ja) * 1994-04-12 1995-10-27 Matsushita Electric Ind Co Ltd 音声対話型情報検索装置
JPH08251307A (ja) * 1995-01-11 1996-09-27 Fujitsu Ltd 音声応答サービス装置
JPH10222521A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 情報共有支援システム
JPH113249A (ja) * 1997-06-11 1999-01-06 Matsushita Electric Ind Co Ltd 操作性評価支援装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03141463A (ja) * 1989-10-27 1991-06-17 Fujitsu Ltd コメント入力支援方式
JPH07282081A (ja) * 1994-04-12 1995-10-27 Matsushita Electric Ind Co Ltd 音声対話型情報検索装置
JPH08251307A (ja) * 1995-01-11 1996-09-27 Fujitsu Ltd 音声応答サービス装置
JPH10222521A (ja) * 1997-01-31 1998-08-21 Toshiba Corp 情報共有支援システム
JPH113249A (ja) * 1997-06-11 1999-01-06 Matsushita Electric Ind Co Ltd 操作性評価支援装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062749A (ja) * 2015-09-25 2017-03-30 株式会社アニモ 情報処理方法及び装置
JP2017167367A (ja) * 2016-03-16 2017-09-21 株式会社東芝 対話コーパス収集装置、方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP3940383B2 (ja) 音声認識精度を決定する方法
KR102582291B1 (ko) 감정 정보 기반의 음성 합성 방법 및 장치
US7200555B1 (en) Speech recognition correction for devices having limited or no display
JP3967952B2 (ja) 文法更新システム及び方法
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
US7280968B2 (en) Synthetically generated speech responses including prosodic characteristics of speech inputs
US6775651B1 (en) Method of transcribing text from computer voice mail
US6801897B2 (en) Method of providing concise forms of natural commands
US7881938B2 (en) Speech bookmarks in a voice user interface using a speech recognition engine and acoustically generated baseforms
US20070239455A1 (en) Method and system for managing pronunciation dictionaries in a speech application
JP2002527829A (ja) 自動照会方法およびシステム
JP5753769B2 (ja) 音声データ検索システムおよびそのためのプログラム
JPWO2006083020A1 (ja) 抽出された音声データを用いて応答音声を生成する音声認識システム
CN112309406A (zh) 声纹注册方法、装置和计算机可读存储介质
JP2012163692A (ja) 音声信号処理システム、音声信号処理方法および音声信号処理方法プログラム
US9218807B2 (en) Calibration of a speech recognition engine using validated text
JP2010197644A (ja) 音声認識システム
JPH10326176A (ja) 音声対話制御方法
JP2019045831A (ja) 音声処理装置、方法およびプログラム
JP2003271182A (ja) 音響モデル作成装置及び音響モデル作成方法
JP3936351B2 (ja) 音声応答サービス装置
KR102474690B1 (ko) 회의록 작성 방법 및 장치
JP2001166785A (ja) 音声対話コーパスの作成装置及び方法
JP2004251998A (ja) 対話理解装置
WO2021059968A1 (ja) 音声認識装置、音声認識方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090616

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100105