JP2007172597A - 音声処理装置及び音声処理方法 - Google Patents

音声処理装置及び音声処理方法 Download PDF

Info

Publication number
JP2007172597A
JP2007172597A JP2006320876A JP2006320876A JP2007172597A JP 2007172597 A JP2007172597 A JP 2007172597A JP 2006320876 A JP2006320876 A JP 2006320876A JP 2006320876 A JP2006320876 A JP 2006320876A JP 2007172597 A JP2007172597 A JP 2007172597A
Authority
JP
Japan
Prior art keywords
fast
speech
forwarding
synthesis
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006320876A
Other languages
English (en)
Other versions
JP2007172597A5 (ja
Inventor
Yasuo Okuya
泰夫 奥谷
Masaaki Yamada
雅章 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006320876A priority Critical patent/JP2007172597A/ja
Publication of JP2007172597A publication Critical patent/JP2007172597A/ja
Publication of JP2007172597A5 publication Critical patent/JP2007172597A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】音声合成において、文書作成者が意図した箇所において、音声出力の早送りを制限可能にする。
【解決手段】音声合成の対象となる発声内容情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別し、早送り設定がされている場合に発声内容情報を音声合成する際に、許可部分については早送り設定による音声合成を実行する。また、早送り設定において発声内容情報を音声合成する際に、制限部分については、上記許可部分とは異なる態様で、例えば通常の発声速度で音声合成を実行する。
【選択図】 図3

Description

本発明は、早送りモードを備えた音声処理に関する。
Webページ等の文書データを音声合成により音声出力することにより、視覚障害者に文書データの内容を伝えることが提案されている。また、視覚障害者がWebページ等の文書の概要を迅速に効率よく把握することを目的として、音声合成における音声の早送り、巻き戻し機能が研究されている。最も一般的な音声の早送りの方法は、合成音声の発声速度を速くするという方法である。また、さらに迅速に、且つ効率よく文書内容を把握するための音声合成による音声の早送りの方法が非特許文献1や特許文献1により提案されている。非特許文献1では、リンクのみを読み上げる方法、読み上げ位置を示すためのカーソルを固定単位で進める方法の2種類の読み飛ばし方法による音声の早送りに関する研究が報告されている。また、特許文献1では、早送りモードの場合に見出しのみを読み上げる方法が提案されている。
特開昭63−231493号公報 電子情報通信学会 信学技報 TL2004-39 WIT2004-63 (2005-01)
しかしながら、発声速度を速くする方法や、非特許文献1や特許文献1で示す早送り方法では、文書作成者が意図するその文書の重要な個所とは無関係に早送りや読み飛ばしが実行される。そのため、文書の重要な個所が聴き取りにくくなってしまったり、読み上げられなかったりするという課題があった。
本発明は上記の課題に鑑みてなされたものであり、音声合成において、文書作成者が意図した箇所において、音声出力の早送りを制限可能にすることを目的とする。
上記の目的を達成するための本発明による音声処理装置は、
音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別手段と、
早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記許可部分について、前記早送り設定による音声合成を実行する第1合成手段と、
早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記制限部分について、前記第1合成手段と異なる態様で音声合成を実行する第2合成手段とを備える。
また、上記の目的を達成するための本発明による音声処理方法は
音声処理装置による音声処理方法であって、
識別手段が、音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別工程と、
第1合成手段が、早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記許可部分について前記早送り設定による音声合成を実行する第1合成工程と、
第2合成手段が、早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記制限部分について前記第1合成工程と異なる態様で音声合成を実行する第2合成工程とを備える。
本発明によれば、音声合成において、文書作成者が予め指定した箇所において、音声出力の早送りを制限することが可能となる。このため、文書作成者が予め指定した箇所について音声出力の早送りを制限することができ、文書の重要な個所が聴き取りにくくなってしまったり読み飛ばされてしまったりする可能性を低減させることができる。
以下、添付の図面を参照して本発明の好適な実施形態のいくつかについて詳細に説明する。
[第1実施形態]
第1実施形態では、HTMLなどに代表されるタグ付きテキストを入力とし、タグ付きテキストから抽出されたコンテンツを音声に変換する音声処理装置について説明する。なお、第1実施形態における「早送り」とは、通常より速い発声速度の音声合成を行うことであり、そのような音声合成を実行するモードを早送りモードという。また、通常の発声速度で発声するモードを通常モードという。
図4は、第1実施形態の音声合成による読み上げの対象となるタグ付きテキストの一例を示す図である。開始タグ〈h1〉と終了タグ〈/h1〉や、開始タグ〈p〉と終了タグ〈/p〉で囲まれた部分は、音声合成による読み上げ対象箇所である。ここではこのようにタグで囲まれた部分をコンテンツと呼ぶ。読み上げ対象を示すタグで囲まれたコンテンツは発声内容を表す発声内容情報である。また、文書作成者は開始タグ〈mustRead〉および終了タグ〈/mustRead〉を使って、早送りモード(早送り設定ともいう)でも通常の発声速度で音声合成されるべき個所を指定する。このように早送りモードでも早送りを行わないように制限した部分を制限部分と称する。図4では、「なお、シンポジウム…ご連絡ください。」の部分が開始タグ〈mustRead〉および終了タグ〈/mustRead〉で囲まれており、制限部分となっている。
図4に示すタグ付きテキストが本実施形態の音声処理装置に入力されると、次のように音声の合成処理が行われる。出力モードが早送りに設定されている場合、開始タグ〈mustRead〉と終了タグ〈/mustRead〉で囲まれた部分以外は早送りで音声合成される。また、開始タグ〈mustRead〉と終了タグ〈/mustRead〉で囲まれた部分は通常の発声速度で音声合成される。一方、出力モードが早送り設定(早送りモード)でない場合は、開始タグ〈mustRead〉と終了タグ〈/mustRead〉で囲まれているか否かにかかわらず、通常の発声速度で音声合成される。以上のように、本実施形態では、発声内容情報は、制限部分の発声内容を表すテキスト列が予め定義されたタグによって囲まれたタグ付きテキスト情報となっている。
以上のような機能を実現する本実施形態の音声処理装置の構成および動作について、図1〜図3を用いて、以下、説明する。
図1は、第1実施形態における音声処理装置のハードウエア構成を示すブロック図である。
図1において、制御メモリ101には本実施形態の音声処理の手順や必要な固定的データが格納される。中央処理装置102は、数値演算/制御等の処理を行う。メモリ103には一時的なデータが格納される。外部記憶装置104には処理対象の文書データ等、各種データやプログラムが格納され、それらは必要に応じてメモリ103にロードされる。入力装置105は、ユーザが本装置に対してデータを入力したり、動作を指示したりするのに用いられる。出力装置106は、中央処理装置102の制御下でユーザに対して各種の情報を提示する。出力装置106としては、CRTやLCD等の表示装置が一般的である。音声出力装置107は、音声合成処理によって生成された合成音声を出力する。上述した各装置はバス108に接続されており、各装置間のデータのやり取りはバス108を通じて行われる。
図2は、第1実施形態における音声処理装置のモジュール構成を示すブロック図である。なお、各モジュールは中央処理装置102が制御メモリ101あるいは外部記憶装置104からメモリ103にロードされた制御プログラムを実行することにより実現される。
図2において、モード識別部201は出力モードを取得して早送りモードか否かの識別を行う。早送りモード及び通常モード等のモード設定は入力装置105を介して行われる。モード保持部202はモード識別部201の識別結果を保持する。テキスト保持部203は図4に示したような、音声合成対象のタグ付きテキストを保持する。テキスト構造解析部204はテキスト保持部203によって保持されたタグ付きテキストを解析し、コンテンツもしくは制御情報を取得する。テキスト構造保持部205は、テキスト構造解析部204によって得られたコンテンツもしくは制御情報を保持する。早送り可否情報取得部206は、テキスト構造保持部205が保持する制御情報から早送り可否情報を取得する。可否情報保持部207は、早送り可否情報取得部206が取得した早送り可否情報を保持する。発声速度決定部209は、モード保持部202が保持するモード情報および可否情報保持部207が保持する早送り可否情報から音声合成の発声速度を決定する。発声速度保持部210は、発声速度を保持する。音声合成部208は、発声速度保持部210が保持する発声速度にしたがって音声合成を行う。
なお、本実施形態におけるテキスト構造解析部204は、タグ付きテキストを逐次解析するものとする。また、上記各保持部(202,203,205,207,210)は、メモリ103を用いて各種データの保持を行う。
図3は第1実施形態における音声処理装置の処理を示すフローチャートである。以下、図3のフローチャートを参照して第1実施形態による音声処理を説明する。なお、図3に示す処理の開始時においてテキスト保持部203には発声すべき文字列(タグ〈p〉と〈/p〉で囲まれた文字列)を含む図4の如きテキストが保持されている。
ステップS301において、テキスト構造解析部204は、テキスト保持部203に保持されているタグ付きテキストの中に未処理の部分が存在するかどうかを識別する。未処理の部分が存在すると識別された場合はステップS302に移り、未処理の部分が存在しないと識別された場合は本処理を終了する。
ステップS302において、テキスト構造解析部204は、テキスト保持部203に保持されているタグ付きテキストの未処理部分の先頭から特定の範囲の文字列を抽出する。
ここで一度に抽出される単位はタグ(“〈”から“〉”の範囲)、或いは、タグによって囲まれた部分とする。テキスト構造解析部204はテキスト保持部203から抽出した文字列をテキスト構造保持部205に保持する。例えば、図4の例の場合、「〈h1〉」→「音声合成シンポジウム開催のご案内」→「〈/h1〉」…というように文字列が抽出される。
次に、ステップS303において、テキスト構造保持部205に保持されている文字列が制御情報か否かを判定する。この判定の結果、制御情報であった場合はステップS304に処理が進む。本例において、制御情報である場合とは、保持されている文字列が「タグ」を記述する文字列であった場合である。即ち、〈h1〉や〈/h1〉は制御情報と判定される。また、制御情報以外の場合とは、タグとタグの間に記述されたコンテンツに該当する文字列である。
ステップS304において、早送り可否情報取得部206は、テキスト構造保持部205が保持する文字列によって表される制御情報が早送りの適用を制限するものであるか否かを識別する。本例では、早送りを制限する制御情報として、図4に示した〈mustRead〉と〈/mustRead〉を用いており、それぞれ早送りの制限範囲の開始と終了に対応する。ステップS304において、テキスト構造保持部205に保持されている制御情報が、早送りの制限開始タグ(〈mustRead〉タグ)であった場合は、早送りが否であることを可否情報保持部207に保持してステップS301に戻る。一方、早送り制限の終了タグ(〈/mustRead〉タグ)であった場合は、早送りが可であることを可否情報保持部207に保持してステップS301に戻る。また、制御情報がそれ以外の場合は、そのままステップS301に戻る。
ステップS303においてテキスト構造保持部205に保持されている文字列が制御情報ではない場合、本実施形態では、当該文字列はコンテンツを示す文字列である。この場合、処理はステップS303からステップS305へ進む。ステップS305では、モード識別部201が現在の出力モードを取得し、出力モードが早送りモードであるか否かをモード保持部202に保持する。続いて、ステップS306〜S308において、発声速度決定部209は、可否情報保持部207が保持する早送り可否情報とモード保持部202が保持するモード情報から音声合成の発声速度を決定し、結果を発声速度保持部210に保持する。即ち、早送り可否情報が可で、かつ、出力モードが早送りである場合はステップS306からステップS307に処理が進む。ステップS307において、発声速度決定部209は早送りに対応した発声速度を発声速度保持部210に保持する。そして、音声合成部208は、発声速度保持部210が保持する早送りの発声速度にしたがって、テキスト構造保持部205に保持されている文字列を音声合成する。この結果、テキスト構造保持部205に保持されている文字列は早送りで音声合成される。本実施形態では、通常の発声速度よりも早いピッチで発声することにより、早送りの音声合成を実現する。その後、ステップS301に戻る。
一方、ステップS306において、早送り可否情報が否であった場合、或いは出力モードが早送りでない場合は、ステップS308へ進む。ステップS308において、発声速度決定部209は通常の発声速度を発声速度保持部210に保持する。音声合成部208は、発声速度保持部210が保持する通常の発声速度にしたがって、テキスト構造保持部205に保持されている文字列を音声合成し、ステップS301に戻る。この結果、テキスト構造保持部205に保持されている文字列は通常の速度で音声合成される。以上のステップS302〜S308の処理では、早送り可否情報取得部206が、音声合成の対象となる発声内容情報(コンテンツ)から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する。そして、早送り可否情報取得部206は、その識別結果を可否情報保持部207に保持する(S304)。次に、発声速度決定部209、発声速度保持部210、音声合成部208は、早送り設定(早送りモード)において、各発声内容情報(コンテンツ)を音声合成する際に、上記許可部分については、早送り設定による音声合成を実行する(S305〜S307)。一方、発声速度決定部209、発声速度保持部210、音声合成部208は、早送り設定において、制限部分と識別されたコンテンツに対しては、第1合成手段と異なる態様で、上記例では通常の速度で音声合成を実行する(S308)。
以上のステップS302〜S306の処理は、タグで囲まれたコンテンツが、早送り許可であるか、早送り制限であるかを、当該コンテンツを囲むタグの内容に基づいて判定するものであり、上記はその判定方法の一例に過ぎない。また、上記ではタグ付きテキストを用いたが、コンテンツが早送り許可であるか、早送り制限であるかが明示されたものであればタグ付きテキスト以外であってもよい。
以上説明したように、第1実施形態によれば、出力モードが早送りであった場合でも、所定の制御情報によって指定された範囲(上記の例では〈mustRead〉と〈/mustRead〉で囲まれた範囲)の文字列に対しては通常速度で音声合成される。このため、音声合成対象の文書の作成者は、出力モードが早送りであった場合でも通常速度で発声させたい部分を容易に指定することができる。
[第2実施形態]
第1実施形態では、テキスト保持部203が保持するテキストをテキスト構造解析部204が逐次処理する場合について説明した。しかしながら、本発明はこのような形態に限定されるものではない。例えば、テキスト全体を一括で解析するようにしてもよく、第2実施形態ではそのような処理を説明する。
図5は、第2実施形態における音声処理装置の処理を示すフローチャートである。なお、第2実施形態における音声処理装置のモジュール構成は、第1実施形態と同様であるため省略する。
まず、ステップS501において、テキスト構造解析部204はテキスト保持部203に保持されているタグ付きテキストの構造解析を行う。すなわち、タグ付きテキストのツリー構造(図6により後述する)および各ノードの制御情報とコンテンツを識別し、それら識別結果をテキスト構造保持部205に保持する。次に、ステップS502において、ルートからツリー構造を辿って最初のコンテンツに関する未処理ノードが選択される。コンテンツに関する未処理のノードが存在する場合はステップS503に移り、未処理のノードが存在しない場合は本処理を終了する。
ステップS503において、早送り可否情報取得部206は、ステップS205において選択されたノードからルートに向かってノードを逆に辿り、この過程で各ノードが早送り制限タグのノードであるかどうかを識別する。ルートまで辿る間に早送り制限タグが存在した場合は早送り可否情報を「否(即ち、制限部分)」とし、存在しなかった場合は早送り可否情報を「可(即ち、許可部分)」として可否情報保持部207に保持する。続いて、ステップS504において、モード識別部201は現在の出力モードが早送りモードであるか否かを識別し、その識別結果をモード保持部202に保持する。
ステップS505において、発声速度決定部209は、可否情報保持部207が保持する早送り可否情報とモード保持部202が保持するモード情報から音声合成の発声速度を決定し、処理を分岐する。すなわち、早送り可否情報が可で、かつ、出力モードが早送りである場合はステップS506に進む。ステップS506では、早送りの発声速度を音声合成速度として発声速度保持部210に保持し、音声合成部208は早送りで音声合成を実行する。一方、早送り可否情報が否、或いは、出力モードが通常モードであった場合は、ステップS507へ進む。ステップS507では、通常の発声速度を音声合成速度として発声速度保持部210に保持し、音声合成部208は通常の速度で音声合成を実行する。ステップS506或いはステップS507によって当該ノードに関する音声合成を終えると、処理はステップS502に戻る。
図6は、テキスト構造解析部204によって図4に示したタグ付きテキストが解析された場合に得られるツリー構造の一例を示した図である。図6において、601はツリーのルートノードである。ノード602や608のように角の丸い四角形で示されたノードは制御情報を表す。特に、ノード608は、早送り制限のための制御情報である。一方、ノード603〜607はコンテンツを示すノードである。
例えば、コンテンツに関するノード606を処理する際は、ルートに向かってノードを辿る過程で早送り制限のための制御情報であるノード608を通過する(S503)。よって、ノード606を音声合成する場合は、出力モードが早送りモードでも早送りせずに通常の発声速度で音声合成が行われることになる(S504,S505,S507)。一方、ノード604、605、607では、ルートに向かってノードを辿る過程で早送り制限のための制御情報を示すノードを通過しない。よって、ノード604、605、607を音声合成する場合は、出力モードが早送りであれば早送りで音声合成が行われることになる(S505,S506)。なお、ノード603はheadの中のtitleタグにつながっており、ここでは音声合成の対象としない。また、図4における改行タグ〈br〉に相当するノードは、本実施形態の本質に関係がないので図6では省略した。
以上説明したように、第2実施形態によれば、ツリー構造を参照して音声合成処理時の早送りモードの可否が識別される。
[第3実施形態]
第1実施形態および第2実施形態では、「早送りモード」の実現方法として通常より速い発声速度で音声合成を行うようにした。しかしながら、早送りモードの実現形態はこれに限定されるものではなく、例えば、コンテンツを読み飛ばすことにより「早送りモード」を実現するようにしてもよい。第3実施形態では、そのような「早送りモード」の実現形態を利用した場合の構成の例を説明する。なお、第3実施形態では、第2実施形態をベースに、品詞が名詞である単語だけを読み上げることで、即ち、発声内容情報を間引いて合成音声を生成することで「早送り」を実現する場合について説明する。
図7は、第3実施形態における音声処理装置のモジュール構成を示すブロック図である。なお、図7の各モジュールは、図1の中央処理装置102が制御メモリ101あるいは外部記憶装置104からメモリ103にロードされた制御プログラムを実行することにより実現される。図7において、201〜207の各処理部は第2実施形態と同じ処理を行う。読み上げ対象決定部701は、モード保持部202が保持するモード情報および可否情報保持部207が保持する早送り可否情報を基に、通常通り読み上げるのか、それとも、早送りモードのための読み飛ばしを実行するかを決定する。そして、読み上げ対象決定部701は、読み飛ばしを実行する場合は、コンテンツを形態素解析して品詞を特定し、名詞と判定された単語を読み上げ対象とする。読み上げ対象保持部702は、形態素解析によって名詞と判定された単語のみを読み上げ対象として保持する。音声合成部703は、読み上げ対象保持部702が保持する名詞の単語を音声合成して出力する。一方、読み飛ばしを行わない場合は、読み上げ対象決定部701はコンテンツの全体を読み上げ対象として読み上げ対象保持部702に保持する。音声合成部703は、読み上げ対象保持部702が保持する読み上げ対象を音声合成して出力する。
図8は、第3実施形態における音声処理装置の処理の流れを示すフローチャートである。図8において、ステップS501〜ステップS504の各ステップは第2実施形態(図5)と同じ処理を行う。
ステップS801において、読み上げ対象決定部701は、可否情報保持部207が保持する早送り可否情報とモード保持部202が保持するモード情報から早送りモードによる発声を行うか否か、すなわち読み飛ばしを行うか否かを決定する。早送り可否情報が可で、かつ、出力モードが早送りである場合は「早送りモード」による音声合成を行うため、ステップS801からステップS802に進む。ステップS802において、読み上げ対象決定部701は当該ノードのコンテンツを形態素解析して各単語の品詞を特定する。そして、品詞が名詞である単語を読み上げ対象保持部702に保持して、ステップS803に処理を進める。ステップS803では、音声合成部703が、読み上げ対象保持部702に保持された単語を音声合成することにより、読み飛ばしによる早送りモードの音声合成出力が得られる。その後、当該ノードに関して音声合成を終えると処理はステップS502に戻る。
一方、早送り可否情報が否である場合、或いは、出力モードが早送りでない場合は、通常の速度による音声合成を行うため、当該ノードのコンテンツを読み上げ対象保持部702に保持してステップS801からステップS803へ進む。ステップS803では、音声合成部703が読み上げ対象保持部702が保持する読み上げ対象を音声合成する。この結果、当該ノードの全コンテンツが音声合成されて、通常速度による音声合成出力が得られることになる。当該ノードの読み上げ対象の音声合成を終えると処理はステップS502に戻る。
以上説明したように、早送りモードにおいてコンテンツを間引きして音声合成する場合においても、早送りの制限が指定された範囲に関しては通常の発声速度で音声合成されるので、文書作成者が指定した部分のコンテンツを確実に聴き取ることが容易になる。
[第4実施形態]
第3実施形態では、「早送り」の方法として品詞が名詞である単語だけを読み上げ、早送り不可の場合には読み飛ばさずに音声合成する場合について説明した。即ち、「早送りモード」における音声合成として、発声速度を変更するのではなく、発声の内容を変更する(読み飛ばす)ことにより「早送り」を実現した。しかしながら読み上げ対象の変更方法は読み飛ばしに限られるものではない。第3実施形態では、コンテンツを要約して読み上げることにより「早送り」を実現する場合を説明する。
第4実施形態のモジュール構成及び処理の流れは第3実施形態と同様であるので、以下では、図7および図8を用いて第4実施形態を説明する。
図7において、読み上げ対象決定部701は、モード保持部202が保持するモード情報および可否情報保持部207が保持する早送り可否情報を基に、通常通り読み上げるのか、コンテンツの要約を行うかを決定する。要約を行う場合は、意味解析や単語の重要度などを鑑みて行う既存の手法を用いてコンテンツの要約を行う。なお、それ以外のモジュールは第3実施形態と同じ処理であるため説明を省略する。
図8において、ステップS801では、読み上げ対象決定部701が、モード保持部202が保持するモード情報および可否情報保持部207が保持する早送り可否情報を基に、通常通り読み上げるか、コンテンツを要約して読み上げるかを決定する。コンテンツの要約を行う場合はステップS802に移り、それ以外の場合はコンテンツを読み上げ対象保持部702に保持して、ステップS803に移る。
ステップS802では、読み上げ対象決定部701が、当該ノードのコンテンツを要約し、読み上げ対象保持部702に保持して、ステップS803に移る。なお、それ以外の工程は第2実施形態と同じ処理であるため説明を省略する。
以上のように、早送りモードにおいてコンテンツを要約して音声合成が行われる場合においても、早送りの制限が指定された範囲に関しては通常の発声速度で音声合成されるので、文書作成者が指定した部分のコンテンツを確実に聴き取ることが容易になる。
[第5実施形態]
第1実施形態乃至第4実施形態では、タグ付きテキストを音声合成で読み上げる際に、タグで指定される早送りの可否情報に基づいて早送りを制限する場合について説明したが、これに限定されるものではない。例えば、早送りの可否情報が付与された音声データを再生する際に、その可否情報に基づいて早送りを制限するようにしてもよい。このようにすることで、本発明は、発声内容情報がタグ付きテキストではなく音声データの場合にも適用できる。以下、早送りの可否情報が付与された音声データの再生制御を説明する。
図9は、早送りの可否情報とそれに対応する音声データを示した模式図である。図9において、901〜904は音声データに対応する時間情報もしくは波形の位置に対応する点を表す(以下、時点という)ものとする。時点901から時点902の間は早送り可(許可部分)、時点902から時点903の間は早送り不可(制限部分)、時点903から時点904の間は早送り可(許可部分)が設定されているとする。なお、905は音声データを表示した音声波形である。このようにコンテンツ作成者は、予め音声データと早送り可否情報を対応付けておくものとする。この対応付けの方法は、対象となる音声データを選択して早送り可否を指定したり、早送り箇所を指定するモードにして対象となる音声データから区間を選択したりする等、どのような方法を用いても構わない。上記のように、第5実施形態の声内容情報は音声データであり、この音声データは、音声データを区切って設定された各音声区間に制限部分と許可部分の何れであるかを識別可能な情報が付加されている。
図10は、第5実施形態における音声処理装置のモジュール構成を示すブロック図である。なお、図10の各モジュールは、図1の中央処理装置102が制御メモリ101あるいは外部記憶装置104からメモリ103にロードされた制御プログラムを実行することにより実現される。モード識別部1001は出力モードを取得して早送りモードか否かの識別を行う。なお、出力モードとしては、例えば早送りモードと通常モードの何れかをユーザ操作によって設定可能であるとする。モード保持部1002はモード識別部1001の識別結果、即ち設定されている出力モードを示す出力モード情報を保持する。早送り可否情報取得部1003は、音声データに付与されている早送り可否情報を取得する。可否情報保持部1004は、早送り可否情報取得部1003が取得した早送り可否情報を保持する。再生速度決定部1005は、モード保持部1002が保持する出力モード情報および可否情報保持部1004が保持する早送り可否情報から再生速度を決定する。再生速度保持部1006は、再生速度決定部1005で決定された再生速度を保持する。音声再生部1007は、再生速度保持部1006が保持する再生速度にしたがって音声データの再生を行う。再生速度保持部1006には早送りモードのための再生速度か通常モードのための再生速度が保持されることになる。
図11は、第5実施形態における音声処理装置の処理の流れを示すフローチャートである。本実施形態では、音声データの再生は所定のフレーム単位で行うものとして説明する。なお、言うまでもないことであるが、再生単位はフレームに限らず、1サンプルごとでもよく、任意の単位でよいものとする。
まず、ステップS1101において、未処理の音声データが存在する場合はステップS1102に移り、未処理の音声データが存在しなければ本処理を終了する。ステップS1102では、早送り可否情報取得部1003が、当該フレームに対応する早送り可否情報を取得し、可否情報保持部1004に保持する。本実施形態では、時点901〜902、903〜904の間のフレームには早送り許可が、時点902〜903の間のフレームには早送り不可が設定されているものとする。但し、早送り可否の取得はこれに限られるものではない。例えば、時点901〜902、時点903〜904には早送り可を設定し、時点902〜903には早送り不可を設定しておき、処理対象フレームがどの時点に属するかに基づいて早送り可否情報を取得するようにしてもよい。
ステップS1103において、モード識別部1001は、早送りモードか否かを識別し、その結果をモード保持部1002に保持する。次に、ステップS1104〜S1106において、再生速度決定部1005は、可否情報保持部1004が保持する早送り可否情報とモード保持部1002が保持するモード情報から再生速度を決定し、再生速度保持部1006に保持する。即ち、早送り可否情報が可で、かつ、出力モードが早送りである場合はステップS1105に移る。そして、ステップS1105において、再生速度決定部1005は、早送りに対応した再生速度を再生速度保持部1006に保持する。音声再生部1007は、再生速度保持部1006に保持されている再生速度にしたがって、当該フレームを早送りで再生し、その後、ステップS1101に戻る。一方、ステップS1104において、早送り可否情報が否、或いは、出力モードが通常モードであった場合は、ステップS1106へ進む。ステップS1106において、再生速度決定部1005は、通常の発声速度に対応した再生速度を再生速度保持部1006に保持する。音声再生部1007は、再生速度保持部1006に保持されている再生速度にしたがって当該フレームを通常速度で再生し、ステップS1101に戻る。
以上のように、第5実施形態によれば、音声データに直接的に早送りの可否を設定できる。
[第6実施形態]
第1実施形態では、早送りを制限する開始タグ〈mustRead〉と終了タグ〈/mustRead〉で囲まれた部分を通常の発声速度で合成する場合について説明したが、これに限定されるものではない。例えば、早送りの速度制限を行うようにすることも可能である。
図12は、速度制限を記述したタグ付きテキストの一例を示す図である。第1実施形態の図4との違いは、開始タグ〈mustRead〉に属性speakingRateLimitが追加され、属性値が“2.0”に設定されている点である。
開始タグ〈mustRead〉に属性speakingRateLimitおよびその属性値を指定することにより、前記属性値よりも速い発声速度で音声合成することを抑制する。すなわち、この属性値は発声速度の制限速度を意味している。また、ユーザが設定した発声速度(以下、設定速度)がタグで指定された制限速度以下の場合は、設定速度で音声合成を行う。
以下、第6実施形態における音声処理装置の構成および動作について、図13および図14を用いて説明する。
図13は、第6実施形態における音声処理装置のモジュール構成を示すブロック図である。第1実施形態の図2で示したモジュールと同じ処理を行うモジュールは図2と同じ符号を付与し、説明を省略する。
図13において、設定速度識別部1301は、ユーザが設定した現在の設定速度を識別する。設定速度保持部1302は、設定速度識別部1301が識別した設定速度を保持する。早送り制限情報取得部1303は、テキスト構造保持部205が保持する制御情報から早送り制限情報を取得する。本実施形態における早送り制限情報とは、早送りの制限速度である。制限情報保持部1304は、早送りの制限速度を保持する。
図14は第6実施形態における音声処理装置の処理を示すフローチャートである。以下、図14のフローチャートを参照して第6実施形態による音声処理を説明する。なお、第1実施形態の図3に記載したステップと同じ処理を行う工程には図3と同じ符号を付与し、説明を省略する。
ステップS1401において、早送り制限情報取得部1303は、テキスト構造保持部205が保持する文字列によって表される制御情報から早送りの制限速度を抽出する。本例では、タグ〈mustRead〉の属性“speakingRateLimit”の属性値を取得することに相当する。制限速度を制限情報保持部1304に保持して、ステップS301に戻る。一方、早送り制限の終了タグ(〈/mustRead〉タグ)であった場合は、既に設定されている制限速度を未設定の状態(制限なし)に戻して、ステップS301に戻る。また、制御情報がそれ以外の場合は、そのままステップS301に戻る。以上のように、ステップS301〜S303の処理によれば、早送り制限情報取得部1303は、音声合成の対象となる発声内容情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する。そして、制限部分に関しては、発声速度の上限値を取得し、これを制限情報保持部1304に保持する。
ステップS303においてテキスト構造保持部205に保持されている文字列が制御情報ではない場合、本実施形態では、当該文字列は発声内容を示すコンテンツである。この場合、処理はステップS303からステップS1402へ進む。ステップS1402では、設定速度識別部1301が現在ユーザによって設定されている設定速度を取得し、設定速度を設定速度保持部1302に保持する。続いて、ステップS1403において、発声速度決定部209は、制限情報保持部1304が保持する早送りの制限速度と設定速度保持部1302が保持する設定速度を比較する。そして、当該コンテンツが制限対象(制限部分)であり、制限速度が設定されており、かつ、設定速度が制限速度より大きい場合はステップS1404に進む。ステップS1404では、発声速度決定部209が、制限情報保持部1304に保持されている制限速度を発声速度保持部210に保持する。そして、音声合成部208が、発声速度保持部210が保持する発声速度(制限速度)にしたがって、テキスト構造保持部205に保持されている文字列(コンテンツ)を早送りで音声合成する。その後、ステップS301に戻る。
一方、ステップS1403において、早送り制限速度が設定されていない場合、或いは設定速度が制限速度以下の場合は、ステップS1405へ進む。これは、例えば、ユーザが早送りモードのために設定した発声速度が制限速度を超えていない場合があげられる。ステップS1405では、発声速度決定部209が、設定速度保持部1302に保持されている設定速度を発声速度保持部210に保持する。そして、音声合成部208は、発声速度保持部210が保持する発声速度(設定速度)にしたがって、テキスト構造保持部205に保持されている文字列(コンテンツ)を音声合成し、ステップS301に戻る。以上のように、設定速度識別部1301は、ユーザが指定する発声のための設定速度を取得し、これを設定速度保持部1302に保持する(S1402)。そして、制限部分について声内容情報を音声合成する際には、発声速度決定部209及び音声合成部208は、設定速度が制限速度より大きい場合は当該制限速度にしたがって音声合成を実行する(S1404)。
以上のステップS302、S303、S1401、S1402、S1403の処理は、タグで囲まれたコンテンツを音声合成する際の発声速度を、当該テキスト列を囲むタグの内容に基づいて判定するものであり、上記はその判定方法の一例に過ぎない。また、上記ではタグ付きテキストを用いたが、発声内容を音声合成する際の発声速度が明示されたものであればタグ付きテキスト以外であってもよい。尚、第6実施形態では、早送りモードと通常モードに分け、早送りモードにおける発声速度を制限したがこれに限られるものではない。例えば、早送りモードと通常モードを区別せずに、発声速度(設定速度)を段階的に変更することが可能な構成において、ステップS1403〜S1405の処理を随時実行するようにしてもよい。このようにすれば、発声速度を好みの速度に設定可能な構成において、制限部分については常に制限速度以下で発声を行わせることができる。
以上説明したように、第6実施形態によれば、所定の制御情報によって指定された範囲の文字列に対して制限速度が設定されている場合は、ユーザによって設定された設定速度が制限速度より大きくても発声対象の文字列は制限速度で音声合成される。尚、第6実施形態の例では、所定の制御情報によって指定された範囲の文字列は、〈mustRead〉と〈/mustRead〉で囲まれた範囲の文字列である。このため、音声合成対象の文書の作成者は、ユーザが設定した設定速度に関わらず制限速度以下で発声させたい部分を容易に指定することができる。
[他の実施形態]
上記第3実施形態では、早送り方法の一例として名詞だけを読み上げ、それ以外を読み飛ばす場合について説明したがこれに限定されるものではない。例えば、名詞に限らず品詞に基づく選択、自立語/付属語に基づく選択、あるいは、文単位、節単位、句単位、単語単位、固定文字長単位、固定時間長単位など任意の方法で実現することができる。
また、第5実施形態では、早送りの実現方法として再生速度を早くする場合について説明したが、これに限定されるものではない。例えば、読み飛ばしによる「早送り」を行う場合ようにしてもよい。第5実施形態における読み飛ばしの方法としては、所定時間間隔で音声データを抽出して再生することが挙げられる。或いは、音声の無音部分を検知し、無音から次の無音までを1つの単位として、1つ置きに再生するようにしてもよい。このような読み飛ばしを採用した場合においても、早送り不可の情報が付与されている音声データについては通常の速度で、読み飛ばすことなく再生がなされることは言うまでもない。
また、第3の実施形態では、「早送り」を音声合成の読み飛ばしにより実現し、早送り不可の場合には通常の発声速度で読み飛ばさずに音声合成する場合について説明したが、これに限定されるものではない。早送りモードにおける効率性を重視するような場合には、早送り不可のコンテンツに対しては、読み飛ばしを行わずに発声速度を早くした音声合成を行うように構成してもよい。
また、第6実施形態では、早送りを制限する開始タグ〈mustRead〉に発声速度の上限値を表す属性“speakingRateLimit”を設定した場合について説明したが、これに限定されるものではない。例えば、開始タグ〈mustRead〉に属性“speakingRateLimit”が設定されていない場合は、第1実施形態と同様に早送りを制限する、つまり、通常の発声速度で音声合成を行う場合もよいものとする。
以上、実施形態を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、1つの機器からなる装置に適用しても良い。
なお、本発明は、ソフトウェアのプログラムをシステム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによって前述した実施形態の機能が達成される場合を含む。この場合、供給されるプログラムは実施形態で図に示したフローチャートに対応したプログラムである。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては以下が挙げられる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などである。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムをハードディスク等の記録媒体にダウンロードすることが挙げられる。この場合、ダウンロードされるプログラムは、圧縮され自動インストール機能を含むファイルであってもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布するという形態をとることもできる。この場合、所定の条件をクリアしたユーザに、インターネットを介してホームページから暗号を解く鍵情報をダウンロードさせ、その鍵情報を使用して暗号化されたプログラムを実行し、プログラムをコンピュータにインストールさせるようにもできる。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどとの協働で実施形態の機能が実現されてもよい。この場合、OSなどが、実際の処理の一部または全部を行ない、その処理によって前述した実施形態の機能が実現される。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれて前述の実施形態の機能の一部或いは全てが実現されてもよい。この場合、機能拡張ボードや機能拡張ユニットにプログラムが書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行う。
第1実施形態における音声処理装置のハードウエア構成を示すブロック図である。 第1実施形態における音声処理装置のモジュール構成を示すブロック図である。 第1実施形態における音声合成処理を示すフローチャートである。 タグ付きテキストの一例を示す図である。 第2実施形態における音声合成処理を示すフローチャートである。 テキスト構造解析部204が図4に示したタグ付きテキストの構造解析を行った場合に得られるツリー構造の例を示した図である。 第3実施形態における音声処理装置のモジュール構成を示すブロック図である。 第3実施形態における音声合成処理を示すフローチャートである。 予め録音された音声波形に対して、コンテンツ作成者が早送りの可否情報を付与した音声データを示した模式図である。 第5実施形態における音声処理装置のモジュール構成を示すブロック図である。 第5実施形態における音声処理装置の処理の流れを示すフローチャートである。 速度制限を記述したタグ付きテキストの一例を示す図である。 第6実施形態における音声処理装置のモジュール構成を示すブロック図である。 第6実施形態における音声合成処理を示すフローチャートである。

Claims (17)

  1. 音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別手段と、
    早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記許可部分について、前記早送り設定による音声合成を実行する第1合成手段と、
    早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記制限部分について、前記第1合成手段と異なる態様で音声合成を実行する第2合成手段とを備えることを特徴とする音声処理装置。
  2. 前記テキスト情報は、前記制限部分の発声内容を表すコンテンツが予め定義されたタグによって囲まれたタグ付きテキストであることを特徴とする請求項1に記載の音声処理装置。
  3. 前記第1合成手段は、早送り設定がされていない場合よりも大きい発声速度で音声合成を行うことを特徴とする請求項1に記載の音声処理装置。
  4. 前記第1合成手段は、前記テキスト情報を間引いて合成音声を生成することを特徴とする請求項1に記載の音声処理装置。
  5. 前記第1合成手段は、前記テキスト情報を要約して合成音声を生成することを特徴とする請求項1に記載の音声処理装置。
  6. 前記第2合成手段は、早送り設定がされていない場合に用いられる速度による音声合成を行うことを特徴とする請求項1乃至3のいずれか1項に記載の音声処理装置。
  7. 前記識別手段は、前記テキスト情報を解析して、コンテンツまたはタグを単位としたノードを有するツリーを生成し、前記ツリーを参照してコンテンツが前記制限部分と前記許可部分の何れであるかを識別することを特徴とする請求項2に記載の音声処理装置。
  8. 音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別手段と、
    早送りの適用を制限する制限部分に関する発声速度の上限値を取得する制限速度取得手段と、
    ユーザにより設定された設定速度を取得する設定速度取得手段と、
    前記制限部分に関して前記設定速度が前記制限速度より大きい場合、前記制限速度にしたがって前記制限部分の音声合成を実行する合成手段を備えることを特徴とする音声処理装置。
  9. 音声処理装置による音声処理方法であって、
    識別手段が、音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別工程と、
    第1合成手段が、早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記許可部分について前記早送り設定による音声合成を実行する第1合成工程と、
    第2合成手段が、早送り設定がされている場合において、前記テキスト情報を音声合成する際に、前記制限部分について前記第1合成工程と異なる態様で音声合成を実行する第2合成工程とを備えることを特徴とする音声処理方法。
  10. 前記テキスト情報は、前記制限部分の発声内容を表すコンテンツが予め定義されたタグによって囲まれたタグ付きテキストであることを特徴とする請求項9に記載の音声処理方法。
  11. 前記第1合成工程では、早送り設定がされていない場合よりも大きい発声速度で音声合成を行うことを特徴とする請求項9に記載の音声処理方法。
  12. 前記第1合成工程では、前記テキスト情報を間引いて合成音声を生成することを特徴とする請求項9に記載の音声処理方法。
  13. 前記第1合成工程では、前記テキスト情報を要約して合成音声を生成することを特徴とする請求項9に記載の音声処理方法。
  14. 前記第2合成工程では、早送り設定がされていない場合に用いられる速度による音声合成を行うことを特徴とする請求項9乃至11のいずれか1項に記載の音声処理方法。
  15. 前記識別工程では、前記テキスト情報を解析して、コンテンツまたはタグを単位としたノードを有するツリーを生成し、前記ツリーを参照してコンテンツが前記制限部分と前記許可部分の何れであるかを識別することを特徴とする請求項10に記載の音声処理方法。
  16. 音声処理装置による音声処理方法であって、
    識別手段が、音声合成の対象となるテキスト情報から、早送りの適用を許可する許可部分と、早送りの適用を制限する制限部分を識別する識別工程と、
    制限速度取得手段が、早送りの適用を制限する制限部分に関する発声速度の上限値を取得する制限速度取得工程と、
    設定速度取得手段が、ユーザにより設定された設定速度を取得する設定速度取得工程と、
    合成手段が、前記制限部分に関して前記設定速度が前記制限速度より大きい場合、前記制限速度にしたがって前記制限部分の音声合成を実行する合成工程を備えることを特徴とする音声処理方法。
  17. 請求項9乃至請求項16のいずれか1項に記載の音声処理方法をコンピュータに実行させるための制御プログラム。
JP2006320876A 2005-11-28 2006-11-28 音声処理装置及び音声処理方法 Pending JP2007172597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006320876A JP2007172597A (ja) 2005-11-28 2006-11-28 音声処理装置及び音声処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005342844 2005-11-28
JP2006320876A JP2007172597A (ja) 2005-11-28 2006-11-28 音声処理装置及び音声処理方法

Publications (2)

Publication Number Publication Date
JP2007172597A true JP2007172597A (ja) 2007-07-05
JP2007172597A5 JP2007172597A5 (ja) 2009-11-26

Family

ID=38299019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006320876A Pending JP2007172597A (ja) 2005-11-28 2006-11-28 音声処理装置及び音声処理方法

Country Status (1)

Country Link
JP (1) JP2007172597A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167384A (ja) * 2016-03-17 2017-09-21 独立行政法人国立高等専門学校機構 音声出力処理装置、音声出力処理プログラムおよび音声出力処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH1173298A (ja) * 1997-08-27 1999-03-16 Internatl Business Mach Corp <Ibm> 音声出力装置およびその方法
JP2004212665A (ja) * 2002-12-27 2004-07-29 Toshiba Corp 話速可変装置及び話速変換方法
JP2005266009A (ja) * 2004-03-16 2005-09-29 Matsushita Electric Ind Co Ltd データ変換プログラムおよびデータ変換装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212228A (ja) * 1995-02-02 1996-08-20 Sanyo Electric Co Ltd 要約文作成装置および要約音声作成装置
JPH1173298A (ja) * 1997-08-27 1999-03-16 Internatl Business Mach Corp <Ibm> 音声出力装置およびその方法
JP2004212665A (ja) * 2002-12-27 2004-07-29 Toshiba Corp 話速可変装置及び話速変換方法
JP2005266009A (ja) * 2004-03-16 2005-09-29 Matsushita Electric Ind Co Ltd データ変換プログラムおよびデータ変換装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167384A (ja) * 2016-03-17 2017-09-21 独立行政法人国立高等専門学校機構 音声出力処理装置、音声出力処理プログラムおよび音声出力処理方法

Similar Documents

Publication Publication Date Title
JP3610083B2 (ja) マルチメディアプレゼンテーション装置および方法
AU2016202974B2 (en) Automatically creating a mapping between text data and audio data
JP4558308B2 (ja) 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム
KR100661687B1 (ko) 대화형 음성 응답 애플리케이션 구현 장치 및 방법, 머신 판독가능 매체 및 대화형 음성 응답 시스템
JP2004523039A (ja) 音声xmlファイルを自動的に生成する方法およびシステム
JP2007264792A (ja) 音声ブラウザプログラム
JP2011100355A (ja) 発言記録装置、発言記録方法、プログラム及び記録媒体
JP4324089B2 (ja) 音声再生プログラムおよびその記録媒体、音声再生装置ならびに音声再生方法
JP2007249653A (ja) マークアップ言語情報の処理装置、情報処理方法、およびプログラム
KR20060088175A (ko) 멀티 포맷을 갖는 전자책 파일 생성 방법 및 시스템
JP2005181960A (ja) Tts探索機能を支援する方法及びこれを用いたマルチメディア装置
JP6791063B2 (ja) 画像データ再生装置、情報処理装置、画像データ再生方法および画像データのデータ構造
JP2007172597A (ja) 音声処理装置及び音声処理方法
US7353175B2 (en) Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user
JP2009283020A (ja) 記録装置、再生装置、及びプログラム
JP2004325905A (ja) 外国語学習装置および外国語学習プログラム
CN105890612A (zh) 一种导航过程中的语音提示方法及装置
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP5383608B2 (ja) 解説放送文作成支援装置及びプログラム
US20070124148A1 (en) Speech processing apparatus and speech processing method
JP2006235880A (ja) 情報処理装置、情報処理方法、情報処理プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
Turunen et al. Mobidic-a mobile dictation and notetaking application.
JP2005148307A (ja) 話速変換装置、話速変換方法、プログラム及び記録媒体
Bigi et al. The Automatic Search for Sounding Segments of SPPAS: Application to Cheese! Corpus
JP2006047866A (ja) 電子辞書装置およびその制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120807

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130208