JP2009230062A - 音声合成装置およびそれを用いた読み上げシステム。 - Google Patents

音声合成装置およびそれを用いた読み上げシステム。 Download PDF

Info

Publication number
JP2009230062A
JP2009230062A JP2008078616A JP2008078616A JP2009230062A JP 2009230062 A JP2009230062 A JP 2009230062A JP 2008078616 A JP2008078616 A JP 2008078616A JP 2008078616 A JP2008078616 A JP 2008078616A JP 2009230062 A JP2009230062 A JP 2009230062A
Authority
JP
Japan
Prior art keywords
data
unit
common part
item
omission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008078616A
Other languages
English (en)
Other versions
JP5082971B2 (ja
Inventor
Kentaro Murase
健太郎 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008078616A priority Critical patent/JP5082971B2/ja
Publication of JP2009230062A publication Critical patent/JP2009230062A/ja
Application granted granted Critical
Publication of JP5082971B2 publication Critical patent/JP5082971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】読み上げ時間を短縮しながらも、ユーザの負担を軽減することを可能にする。
【解決手段】データで示される情報を読み上げるための音声合成装置10は、読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部1と、データ入力部1で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部2と、データ省略部2で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部3とを備える。
【選択図】図1

Description

本発明は、例えば表形式で表される情報のデータのように、項目ごとに分類されたデータ要素により構成されるデータで示される情報の読み上げに用いられる音声合成技術に関する。
紙などの原本に記載された情報を人間が手作業でコンピュータに入力し、電子データを作成する際、入力された情報の確認作業が必要になる。この確認作業を短時間で行う方法の一つに、1人が作成された電子データを示す情報を読み上げ、もう1人が読み上げ音声を聞きながら原本を目視で確認するという、読み合わせ作業がある。
ここで、電子データの示す情報の読み上げに音声合成技術を利用すると、1人でも読み合わせができる。このような読み合わせ作業を効率化する方法が提案されている(例えば、特許文献1参照)。この特許文献1では、当該入力データと前回入力データを比較し、同一であれば、前回と同一である意味を表す音声(例えば「おなじ」という音声)を生成する。これにより、同一データの複数回連続読み上げを防止し、読み上げ時間短縮による効率化を図っている。
特開昭62−288895号公報
しかし、上記特許文献1に記載の方法では、例えば、表形式のデータのように、情報の構成要素が多数の項目に分類されて並べられたデータの読み合わせには効果が少ない。表の読み見上げにおいては、各項目の情報の構成要素を順番に読み上げることが多いからである。
Figure 2009230062
例えば、表1に示すデータでは、「2007年7月2日・東京A物流センター・定型貨物、2007年7月4日・大阪物流センター・特殊貨物・・・・」と読み上げるのが普通で、「東京A物流センター・大阪物流センター・・・」と項目毎に構成要素をまとめて読み上げることは少ない。従って、同一内容のデータが連続することは少ないので、上記特許文献1に記載の方法では、読み上げ時間が短縮されない場合が多くなる。また、上記特許文献1に示されているように、連続する同一内容の構成要素が、「おなじ」という言葉に省略されて読み上げられると、ユーザは、連続する構成要素を見比べる必要があり負担が大きくなる。さらに、「おなじ」という言葉が続けて読み上げられると、ユーザはどこを読み上げているのか分らなくなる恐れがある。
ゆえに、本発明は、読み上げ時間を短縮しながらも、ユーザの負担を軽減することを可能にする音声合成装置を提供することを目的とする。
本願に開示する音声合成装置は、データで示される情報を読み上げるための音声合成装置であって、読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部と、データ入力部で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部と、データ省略部で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部とを備える。
上記構成において、データ入力部は、項目ごとに分類されたデータ要素により構成されるデータを入力する。そして、データ省略部は、各項目に含まれるデータ要素を、データ要素の持つ情報の一部が省略された省略データ要素に変換する。このとき、データ省略部は、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残すように省略データ要素に変換する。そのため、情報の一部が省略されながらも、各項目においては互いに区別可能な情報を読み上げるための音声データが音声合成部により作成される。
このような音声データが読み上げられた場合、データ要素の情報を省略せずに全てを読み上げる場合に比べて、読み上げ時間が短縮される。また、あるデータ要素の情報が読み上げられた時点で、ユーザは項目内のどのデータ要素の情報が読み上げられたかを認識できる。そのため、ユーザの、読み上げ位置を見失わないための労力が軽減される。その結果、上記音声合成装置により、読み上げ時間を短縮しながらも、ユーザの負担を軽減することが可能になる。
なお、データ要素は、読み上げ対象の情報を表すデータにおいて、情報処理の単位となる構成要素である。
本発明によれば、読み上げ時間を短縮しながらも、ユーザの負担を軽減することを可能にする音声合成装置を提供することができる。
本発明の実施形態において、前記データ省略部は、項目毎のデータ要素を抽出する項目データ抽出部と、同一項目内のデータ要素間で共通している共通部分を抽出する共通部分抽出部と、前記共通部分を削除または短縮すること、あるいは、前記共通部分以外の非共通部分を短縮することにより、各項目内の互いに異なるデータ要素を、互いに区別可能な省略語を示す省略データ要素に変換する省略語作成部とを含む構成とすることができる。
共通部分抽出部が抽出する、各項目のデータ要素間の共通部分は、削除または短縮されてもデータ要素を互いに区別することはできる。そのため、省略語作成部は、共通部分抽出部によって抽出された共通部分については削除または短縮、または非共通部分について短縮処理を施すことによって、効率よくデータ要素の情報を省略し、省略データ要素に変換することができる。
本発明の実施形態において、前記データ省略部は、各データ要素を単語に分割する単語分割部をさらに備え、前記共通部分抽出部が同一項目に含まれるデータ要素間の共通部分を、単語単位で抽出し、前記省略語作成部は、抽出された共通部分の単語を削除または短縮、あるいは、非共通部分の単語を短縮することにより、前記データ要素を前記省略データ要素に変換する態様とすることができる。
共通部分抽出部は、共通部分を単語単位で抽出するので、前記省略語作成部は、データ要素に対して、単語単位で削除または短縮を施して省略データ要素に変換することができる。このように、単語単位で削除または短縮が行われることで、わかりやすい省略語を示す省略データ要素に変換される。すなわち、わかりやすく省略された省略語を得ることができる。
本発明の実施形態において、前記データ省略部は、前記データ要素と、省略データ要素との関係を示す省略規則データを記録した省略辞書にアクセス可能であり、省略辞書に記録された省略規則データの示すデータ要素に対応するデータ要素が、前記データ入力部で入力されたデータに存在する場合は、前記省略規則データに従って当該データ要素を省略データ要素に変換する態様とすることができる。
前記データ省略部が、省略辞書の省略規則データに従って、省略データ要素変換する構成とすることで、様々なパターンの省略規則の設定が可能になる。
本発明の実施形態において、前記共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、各項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、前記省略語作成部は、前記全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を判断して省略語を決定し、決定した省略語と省略前のデータ要素の情報との関係を示す省略規則データを生成する省略規則生成部と、前記省略規則生成部が生成した省略規則データに基づいて、前記データ要素を省略データ要素に変換する省略部とを含む構成とすることができる。
上記構成により、共通部分が項目内の全てのデータ要素において共通している場合、一部のデータ要素で共通している場合、および非共通部分の場合で省略規則を変えることができる。例えば、共通部分が項目内の全てのデータ要素において共通している場合には共通部分を削除し、項目内の一部のデータ要素において共通している場合には共通部分を短縮し、非共通部分はさらに異なる短縮を施すといったことが可能になるような省略規則が生成される。
本発明の実施形態における音声合成装置は、前記省略規則生成部が生成した省略規則データをユーザに提示するために出力する省略規則出力部をさらに備える構成とすることができる。
これにより、ユーザは、生成された省略規則を知ることができる。その結果、省略データ要素の示す情報が読み上げられた場合にも、省略後の情報と省略前の情報との対応を把握することができる。
本発明の実施形態における音声合成装置は、省略規則の指定をユーザから受け付ける省略規則指定部をさらに備え、前記省略規則生成部は、前記省略規則指定部が受け付けた省略規則の指定に基づいて、前記省略規則データを生成する態様とすることができる。
これにより、ユーザは、生成された省略規則を制御することができる。例えば、ユーザは、ユーザにとってわかりやすい省略が可能になるように省略規則を調節することができる。
本発明の実施形態において、前記共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、当項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、前記省略語作成部は、前記全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を決定して省略語を生成することにより、データ要素を省略データ要素に変換する態様とすることができる。
上記構成により、共通部分が項目内の全てのデータ要素において共通している場合、一部のデータ要素で共通している場合、および非共通部分の場合でそれぞれ適切な省略データ要素への変換をすることができる。
本発明の実施形態において、前記省略語作成部は、共通部分または非共通部分を短縮する際に、共通部分または非共通部分の長さに基づいて、適用する短縮規則を決定する態様とすることができる。
省略語作成部が、共通部分または非共通部分の長さに応じて短縮することで、わかりやすい省略語の省略データ要素が得られる。
[第1の実施形態]
<音声合成装置の構成>
図1は、本実施形態にかかる音声合成装置の構成を示す機能ブロック図である。図1に示す音声合成装置10は、読み上げ対象データの入力を受け付けて、読み上げ対象データが示す情報を読み上げる音声データを合成し、出力する装置である。音声合成装置10は、例えば、PC(personal computer)等のようなコンピュータの機能の一部として実現される。すなわち、音声合成装置10は、コンピュータで構築されるシステムの1モジュールとして組み込まれる。
音声合成装置10は、データ入力部1、データ省略部2および音声合成部3を備える。データ省略部2は、項目データ抽出部21、識別可能データ抽出部22、共通部分抽出部100および省略語作成部200を含む。省略語作成部200は、さらに、共通部分削除部201、共通部分短縮部202および非共通部分短縮部203を含む。
音声合成装置10におけるデータ入力部1、データ省略部2および音声合成部3の各機能は、コンピュータが備えるCPUが所定のプログラムを実行することにより実現される。したがって、上記各機能部の機能を実現するためのプログラムまたはそれを記録した記録媒体も、本発明の一実施形態である。
本実施形態において、音声合成装置10が入力データとして受け付ける読み上げ対象データは、データ要素の集合であり、データ要素は複数の項目に分類されている。
読み上げ対象データの一例を、下記表1に示す。
Figure 2009230062
表1において、「日付」、「搬入先」および「搬入物」が各項目を示し、〔2007/07/02, 2007/07/04,・・・〕、〔東京A物流センター、大阪物流センター、・・・〕、〔定型貨物、特殊貨物・・・・〕がそれぞれ、各項目に含まれるデータ要素を示す。表1において1つの欄(セル)には1つのデータ要素の情報が示される。1つの列の各欄には、1つの項目に含まれるデータ要素の情報が示される。
本実施形態では、表の列によって、データ要素が各項目に分類される例を説明するが、表の行によってデータ要素を各項目に分類することもできる。また、読み上げ対象データは、表形式で表される場合に限らない。例えば、読み上げ対象データは、ツリーで表されるような、木構造を有するデータであってもよい。この場合、例えば、ツリーの各ノードを各データ要素に対応させ、ノード間の繋がりまたは階層に基づいて、データ要素を各項目に分類することができる。このように、読み上げ対象データのデータ構造や、データ要素を項目ごとに分類する方法は、特に限定されない。
また、どのような情報を1つのデータ要素として扱うかは、読み上げ対象となる情報の性質、用途等に応じて適宜決められる。さらに、本実施形態では、「日付」の項目のデータ要素は日付形式のデータで、「搬入先」および「搬入物」の項目のデータ要素は文字列形式のデータである場合について説明するが、各データ要素の形式は特に限定されず、読み上げ対象情報の性質に応じた適当な形式を用いることができる。
データ入力部1は、表1に示すような、項目毎にまとめられた読み上げ対象データを受け付ける。データ入力部1は、読み上げ対象データを、コンピュータに内蔵されたメモリ、またはCD−ROMのような外部記録装置から読み込んでもよいし、通信回線を介して取得してもよい。
データ省略部2は、各項目に含まれる互いに異なるデータ要素を、互いに区別可能な省略語を示す省略データ要素に変換する。すなわち、各項目内のデータ要素が示す情報を、互いに区別可能な部分を残して省略した省略語を示す省略データ要素が生成される。省略データ要素は、省略データとして音声合成部3へ出力される。
音声合成部3は、省略データが示す情報を読み上げるための音声データを作成する。すなわち、各省略語を読み上げる音声が合成される。この音声合成には、公知の音声合成技術を用いることができる。例えば、音声合成部3は、読み上げ対象の情報に含まれ得る単語を読み情報とともに記録した単語辞書(図示せず)を用いて音声合成を行うことができる。
<音声合成装置の動作>
図2は、音声合成装置10の動作例を示すフローチャートである。ここでは、一例として、表1に示す読み上げ対象データが入力された場合の動作を説明する。表1に示す読み上げ対象データには、日付、搬入先、搬入物の3つの項目が存在する。
データ入力部1が読み上げ対象データを入力すると、項目データ抽出部21は、未処理項目の有無を判定する(Op1)。初めは全ての項目が未処理であるので(Op1でYes)、項目データ抽出部21は、1番目の項目(本例では「日付」項目)に含まれるデータ要素を抽出する(Op2)。本例では、〔2007/07/02, 2007/07/04, 2007/07/08, 2007/07/08〕の4つのデータ要素が抽出される。
次に、識別可能データ抽出部22は、項目内のデータ要素のうち、重複するデータ要素は除いて、互いに異なる識別可能なデータ要素を全て抽出する(Op3)。ここでは、Op2で抽出されたデータ要素のうち、〔2007/07/02, 2007/07/04, 2007/07/08〕の3つのデータ要素が抽出される。
そして、共通部分抽出部100は、Op3で抽出されたデータ項目において、全てのデータ要素で共通している全データ間共通部分と、一部のデータ要素で共通している一部データ間共通部分とを抽出する(Op4)。上記「日付」項目の場合は、全データ間共通部分として「2007/07/」が抽出される。
省略語作成部200は、項目内のデータ要素からの全データ間共通部分の削除または短縮、一部データ間共通部分の短縮、および、非共通部分の短縮の少なくともいずれか1つの処理を実行する。これにより、項目内のデータ要素それぞれに対応する省略データ要素を作成する(Op5)。上記「日付」項目の場合、例えば、全データ間共通部分の削除により、〔02,04,08〕という省略データ要素が作成される。
Op5の後は再び、Op1の処理が実行される。ここでは、「搬入先」、「搬入物」の項目が未処理なので、次の項目「搬入先」についてOp2〜Op5の処理が実行される。このようにして、全項目(ここでは、「日付」、「搬入先」および「搬入物」)についてOp2〜Op5の処理が繰り返される。全項目についてOp2〜Op5の処理が終わると(Op1でNo)、音声合成部3が、各省略データ要素で示される省略語それぞれの音声データを作成する(Op6)。
なお、ここでは、項目毎に省略データを作成し、最後に音声合成を行う例を示したが、各項目の省略データができた時点で音声合成を実行(Op5の後にOp6を実行)してもよい。また、Op2〜Op6それぞれの処理において、全項目に対する処理を繰り返してから、次の処理を実行(すなわち、Op2を全項目に対して実行→Op3を全項目に対して実行→・・・)するようにしてもよい。項目ごとに行われる処理の順序は図2に示した動作例の順序に限定されない。
<データ省略部2の詳細>
以下、データ省略部2の詳細な構成について説明する。項目データ抽出部21は、入力データから項目ごとにデータ要素を抽出する。例えば、表1の読み上げ対象データでは、「日付」の項目のデータ要素として〔2007/07/02, 2007/07/04,・・・〕を、「搬入先」の項目のデータ要素として〔東京A物流センター、大阪物流センター、・・・〕を、「搬入物」の項目のデータ要素として〔定型貨物、特殊貨物・・・・〕を抽出する。
識別可能データ抽出部22は、各項目の中で、同じデータ要素が存在する場合は、重複するデータ要素を除いて各項目からデータ要素を抽出する。これにより、互いに異なるデータ要素のみが抽出される。すなわち、識別可能データ抽出部22は、各項目において互いに識別可能なデータ要素を抽出する。
例えば、表1に示す「日付」の項目からは〔2007/07/02, 2007/07/04,2007/07/08〕の3つのデータ要素が、「搬入先」項目からは〔東京A物流センター、大阪物流センター、東京B物流センター〕の3つのデータ要素が、「搬入物」項目からは〔定型貨物、特殊貨物〕の2つのデータ要素がそれぞれ、識別可能データ抽出部22により抽出される。
共通部分抽出部100では、識別可能データ抽出部22に抽出されたデータ要素の中から、各項目において複数のデータ要素間で共通している部分(共通部分)を抽出する。共通部分は、各項目において抽出される。
例えば、表1に示す「日付」項目においては「2007/07/」が、「搬入先」項目においては「東京」と「物流センター」が、「搬入物」項目においては「貨物」が、共通部分として抽出される。
なお、共通部分には、項目内の全データ要素間で共通する全データ間共通部分と、一部のデータのみで共通する一部データ間共通部分の2種類が存在する。ここでは、共通部分抽出部100が、両者とも抽出する場合について説明するが、後述する省略語作成部200の構成によっては、どちらか一方だけが抽出されてもよい。
表1の例では、「搬入先」項目における「東京」が一部データ間共通部分で、「日付」項目の「2007/07/」、「搬入先」項目の「物流センター」、「搬入物」項目の「貨物」は、全データ間共通部分である。
省略語作成部200は、共通部分抽出部100で抽出された全データ間共通部分を削除する共通部分削除部201、一部データ間共通部分を短縮する共通部分短縮部202、非共通部分を短縮する非共通部分短縮部203で構成される。これらによってデータ要素の情報の一部が省略され、省略データ要素に変換される。すなわち、各データ要素の省略語を示す省略データ要素が生成される。
共通部分短縮部202および非共通部分短縮部203は、例えば、少なくとも、項目内で共通していない非共通部分1文字を残すように、共通部分または非共通部分を短縮することができる。これにより、各項目の互いに異なるデータ要素は、互いに他と区別できる省略語を示す省略データ要素に変換される。
なお、共通部分短縮部202および非共通部分短縮部203は、予め設定された所定の短縮規則に従って短縮する。短縮規則には、例えば、短縮後の残す部分を示す情報および、残す量または短縮度合いを示す情報等が含まれる。具体的には、短縮時にどの部分を残すかを示すパラメータ(「先頭」、「中間」、「終端」または「先頭の単語」等)、残す文字数または音節数を示すパラメータが短縮規則として予め音声合成装置10に記録される。
なお、短縮規則は、共通部分と非共通部分それぞれについて設定されてもよいし、データ要素の性質や種類に応じて複数通りの短縮規則が設定されてもよい。また、後述するように短縮規則をユーザが指定できる構成にすることができる。
例えば、表1に示す読み上げ対象データに対して、共通部分削除部201は、「日付」項目のデータ要素〔2007/07/02, 2007/07/04, 2007/07/08〕から、全データ間共通部分「2007/07/」を削除した省略データ要素〔02, 04, 08〕を生成する。同様に、共通部分削除部201は、「搬入先」項目のデータ要素〔東京A物流センター、大阪物流センター、東京B物流センター〕から全データ間共通部分「物流センター」を削除した省略データ要素〔東京A、大阪、東京B〕を、「搬入物」項目のデータ要素〔定型貨物、特殊貨物〕から全データ間共通部分「貨物」を削除した省略データ要素〔定型、特殊〕を生成する。
共通部分短縮部202は、「搬入先」項目の一部データ間共通部分「東京」を先頭の1文字「東」に短縮して省略データ要素を〔東A、大阪、東B〕とする。さらに、非共通部分短縮部203は、「搬入先」項目の非共通部分「大阪」を、先頭の1文字「大」に短縮して、省略データ要素を最終的に〔東A、大、東B〕と省略する。同様に、「搬入物」項目の省略データ要素は、〔定型、特殊〕から〔定、特〕に省略される。従って、最終的に読み上げられる省略データ要素が示す省略語は、表2のようになる。
Figure 2009230062
このように、省略語作成部200では、各項目のデータ要素は、共通部分が削除または短縮され、非共通部分は削除されずに互いに他を区別できるように短縮される。そのため、各項目データ内で互いに異なるデータ要素で示される情報を、互いに区別可能な省略語に省略することができる。
なお、省略語作成部200は、上記の共通部分削除部201、共通部分短縮部202および非共通部分短縮部203の全てを含む構成である必要はなく、所望の省略度合いに応じて、これらの一部を組み合わせた構成としてもよい。
例えば、共通部分削除部201のみの構成とし、全データ間共通部分を削除することで、下記表3に示すように、表1に示した読み上げ対象データの各項目のデータ要素を、〔02, 04, 08〕、〔東京A、大阪、東京B〕、〔定型、特殊〕と省略することができる。このように、各項目の全データ間共通部分を削除し、互いに異なる部分(一部データ間共通部分および非共通部分)は省略しないようにして、省略語の了解度を上げることができる。
Figure 2009230062
また、上記例は、全データ間共通部分は全て削除する場合であるが、例えば、全データ間共通部分のうち一部は、削除せずに短縮するようにしてもよい。
図3は、省略語作成部の構成の変形例を示す機能ブロック図である。図3に示す省略語作成部210は、省略制御部211、削除部212、短縮部213を備える。削除部212および短縮部213は、省略制御部211により制御される。省略制御部211は、全データ間共通部分、一部データ間共通部分、および非共通部分を示す情報を共通部分抽出部100から受け取る。省略制御部211は、省略語作成部210が受け取ったデータ要素に、全データ間共通部分が含まれている場合に、削除するか短縮するかを判断し、判断に基づいて削除部212および短縮部213を制御する。また、データ要素に含まれる一部データ間共通部分および非共通部分についても短縮するか否かを判断し、削除部212および短縮部213を制御することができる。
全データ間共通部分を削除するか短縮するかは、例えば、全データ間共通部分の長さに応じて決定することができる。具体的には、省略制御部211は、予め設定された閾値を用いて、全データ間共通部分が閾値より長い場合は短縮部213に短縮させ、短い場合は削除部212に削除させることができる。これにより、長いデータは完全に削除せずに一部を残すため、ユーザにとってわかり易い省略語を実現することができる。
図4は、省略語作成部210がデータ要素を受け取った場合の省略制御部211の動作例を示すフローチャートである。省略制御部211は、省略語作成部210が受け取ったデータ要素に、全データ間共通部分があるか否かを判断し(Op11)、全データ間共通部分がある場合(Op11でYes)は、共通部分の長さが所定の閾値を越えるか否かを判断する(Op12)。
Op12において、共通部分の長さの測定方法には、データ要素の形式に応じた方法を用いることができる。例えば、データ要素が文字列で表される場合には、共通部分の文字数を長さとすることができる。日付形式で表される場合は年月日時分秒の時間単位うち、共通している部分の多さによって長さを特定することができる。例えば、表1の「日付」項目の全データ間共通部分「2007/07/」の長さは、年と月の2単位であるので「2」とすることができる。一例として閾値を「3」とすると、「日付」項目の全データ間共通部分「2007/07/」の長さは「2」なので、閾値を越えない(Op12でNo)、「搬入先」項目の全データ間共通部分「物流センター」(=6文字)の長さは「6」なので、閾値を越える(Op12でYes)と判断される。
省略制御部211は、Op12でNoの場合、データ要素の全データ間共通部分を削除するように削除部212に指示し(Op13)、Op12でYesの場合、例えば、全データ間共通部分を、先頭の2文字に短縮するように短縮部213に指示する(Op14)。
また、省略制御部211は、データ要素に一部データ間共通部分または非共通部分が含まれる場合(Op15でYes)、短縮部213に、一部データ共通部分または非共通部分を先頭の2文字に短縮するように指示する(Op16)。
図4に示す処理により、表1に示す読み上げ対象データの各データ要素は、下記表4に示すような省略データ要素に変換される。
Figure 2009230062
このように、ある閾値を決めて、全データ間共通部分が閾値より長い場合は短縮し、短い場合は削除することで、共通部分が長いデータ要素は完全に削除せずに一部を残すことができる。そのため、わかり易い省略語を実現することができる。
なお、省略制御部211は、一部データ間共通部分についても、共通部分の長さに基づいて短縮するか否かを判断してもよいし、非共通部分についても、長さが所定値を越えている場合には短縮するように、短縮部213に指示してもよい。
また、省略制御部211は、共通部分または非共通部分を短縮する場合に、共通部分または非共通部分の長さに応じて適切な短縮規則(何文字残すかを示すパラメータ等)を選択して、短縮部213に短縮規則を指定してもよい。
[第2の実施形態]
図5は、本実施形態にかかる音声合成装置の構成を示す機能ブロック図である。図5において、図1と同じ機能ブロックには同じ番号を付す。図5に示す音声合成装置10aは、単語分割部300を更に備える構成である。また、共通部分抽出部110および省略語作成部220は、図1に示す音声合成装置10における共通部分抽出部100および省略語作成部200とは異なる機能を有する。
単語分割部300は、単語辞書(図示せず)を使った形態素解析により、各項目のデータ要素を単語に分割する。また、単語分割部300は、分割した各単語に読み情報を付加してもよい。なお、単語分割部300が使う単語辞書と形態素解析を実行する機能部(図示せず)は、音声合成部3で用いられるものと共用にすることができる。
また、共通部分抽出部110は、単語分割部300が分割した単語単位で、項目内のデータ要素を比較し、データ要素間で共通する単語を共通部分として抽出する。共通部分抽出部110は、項目内の全てのデータ要素間で共通する単語を全データ間共通部分として抽出し、一部のデータ要素間で共通する単語を一部データ間共通部分として抽出する。
省略語作成部220は、単語単位で削除または短縮を行うことにより省略データ要素を生成する。図5に示す例では、省略語作成部220は、共通部分削除部221を備える。この共通部分削除部221が、共通部分抽出部110が抽出した共通部分をデータ要素から削除する。共通部分は単語単位で抽出されているので、共通部分削除部221は、単語単位で共通部分を削除することになる。
ここで、下記表5に示す読み上げ対象データが入力された場合の、単語分割部300、共通部分抽出部110および省略語作成部220の動作例を説明する。
Figure 2009230062
識別可能データ抽出部22は、互いに異なる識別可能なデータ要素として、〔山梨物流センター、山形物流センター〕を抽出する。単語分割部300は、これらを単語に分割する。例えば、〔山梨|物流|センター、山形|物流|センター〕のように単語に分割される。共通部分抽出部110は、分割された単語単位で共通部分を抽出するので、「物流」および「センター」の2つの単語が全データ間共通部分として抽出される。また、「山梨」および「山形」の単語は、非共通部分として抽出される。
省略語作成部220では、共通部分削除部221が、「物流」および「センター」の単語を削除する。その結果、最終的に、表6に示すように、「搬入先」の項目のデータ要素は、〔山梨、山形〕のように省略データ要素に省略される。
Figure 2009230062
ここで、もし単語分割部300がなく、共通部分抽出部110が単語単位ではなくて文字単位で共通部分を抽出したとすると、「山」および「物流センター」が全データ間共通部分として抽出される。これらが共通部分削除部221で削除されると、最終的に〔梨、形〕という省略データ要素が生成される。これらは互いに区別可能であるが、上記表6に示した省略データ要素〔山梨、山形〕と比べると、日本語として意味を理解し難い。本実施形態のように、単語単位で、共通部分の抽出および削除を行うことにより、わかりやすく省略された省略語を得ることができる。
省略語作成部220は、単語単位で共通部分を短縮することにより省略データ要素を生成してもよい。図6は、本実施形態の省略語作成部の変形例を示す機能ブロック図である。図6に示す省略語作成部230は、共通部分短縮部231を備える。共通部分短縮部231は、全データ間共通部分として抽出された単語の先頭2音節(2拍分)が残るように、データ要素の全データ間共通部分の各単語を短縮する。なお、共通部分短縮部231は、単語分割部300における形態素解析で付加された読み情報から、各単語の音の拍数を示す情報を得ることができる。この拍数を示す情報を用いて、単語の先頭2拍分を特定することができる。
このように、全データ間共通部分の各単語を短縮することにより、上記表5に示したデータ要素は、下記表7のような省略データ要素に変換される。
Figure 2009230062
上記表7では、全データ間共通部分「物流センター」が短縮され、〔山梨物セン、山形物セン〕といった形の省略データ要素に変換されている。全データ間共通部分が長い場合は、全て削除してしまうより、短縮して一部を残しておいた方がわかりやすい場合もある。
なお、省略語のわかりやすさよりも、短さの方が求められる場合には、図7に示す省略語作成部240のように、共通部分削除部241および非共通部分短縮部243を備える構成を採用することができる。この場合、共通部分削除部241は、データ要素から全データ間共通部分を削除する。さらに、非共通部分短縮部243は、例えば、一部データ間共通部分の単語同士、または、非共通部分の単語同士を比較し、各単語に含まれる音のうち共通している音を削除する。これにより、共通していない音の部分が残り、互いに区別可能な音のみが残る。
あるいは、非共通部分短縮部243は、所定の短縮規則(例えば、単語の先頭の1文字だけ残すという規則)に基づいて、一部データ間共通部分または、非共通部分を短縮してもよい。この場合、短縮後の省略語の中で重複するものがないかチェックし、重複する場合、短縮規則を変えて短縮する処理を重複がなくなるまで繰り返してもよい。例えば、非共通部分短縮部243は、単語の先頭の1文字だけ残すという短縮規則で重複が生じた場合は、次に、先頭から2番目の1文字だけ残すという短縮規則で短縮、それでも重複が生じたら先頭から3番目の1文字残すという短縮規則で短縮、・・・という処理を繰り返してもよい。
このような処理により、上記表5に示すデータ要素は、下記表8に示すような互いに区別可能な省略データ要素に省略される。表8に示す例では、省略される量を最大限になっている。
Figure 2009230062
また、図8に示すように、省略語作成部250が、単語単位で削除を行う削除部252、単語単位で短縮を行う短縮部253、およびこれらを制御する省略制御部251を備える構成にしてもよい。上記第1の実施形態の図3に相当する構成である。これにより、省略制御部251は、共通部分として抽出された単語を削除するか短縮するかを、例えば、単語の長さに基づいて判断することもできる。また、省略制御部251は、共通部分および非共通部分それぞれの単語について、短縮度合いを制御することができる。
[第3の実施形態]
図9は、本実施形態にかかる音声合成装置の構成を示す機能ブロック図である。図9において、図5と同じ機能ブロックには同じ番号を付す。図9に示す音声合成装置10bは、省略辞書記録部24および辞書データ省略部25を備える。
省略辞書記録部24には、データ要素の示す情報と、対応する省略データ要素の示す省略語との関係を規定した省略規則データが記録される。省略規則データの一例を下記表9に示す。
Figure 2009230062
上記表9に示す省略規則データは、省略前のデータ要素に含まれ得る表記と、その単語の省略語(省略形)とが対応付けられて記録されたデータである。この例では、省略形における「削除」は、文字通り削除することを意味し、その他は、省略形欄に記された形に短縮することを意味する。
辞書データ省略部25は、このような省略規則データに基づいて、データ要素内の該当する表記を省略語に変換する。省略規則データを参照し、データ要素に、省略規則データの省略前のデータと一致する部分が存在する場合、省略規則データに従って省略語に変換する。
例えば、辞書データ省略部25は、データ要素の中に、省略規則データが示す省略前の文字列が含まれている場合、その文字列を省略規則データが示す省略語(省略形)に変換する。
例えば、上記表9に示す省略規則データを参照すると、文字列「株式会社」の省略形が「削除」となっている。データ要素に文字列「株式会社」が含まれている場合、辞書データ省略部25は、この省略規則データを参照して、このデータ要素中の文字列「株式会社」を削除する。また、例えば、データ要素に文字列「大学」が含まれている場合、辞書データ省略部25は、この文字列「大学」を、上記表9の省略規則データが示す省略語「大」に変換する。
なお、辞書データ省略部25は、省略規則データに従ってデータ要素内の表記を変換する際に、その表記を省略規則データが示す省略語に変換した場合、変換後の省略語が同一項目内の互いに他のデータ要素(または省略データ要素)の表記と区別できるか否かを判断し、他と区別できる場合に限り変換するようにしてもよい。
例えば、辞書データ省略部25は、識別可能データ抽出部22で抽出された項目内のデータ要素全てに対して、その表記を省略規則データに従って変換する。変換後のデータ要素で互いに重複するデータ要素が存在しない場合に限り、変換するようにしてもよい。すなわち、変換後に重複するデータ要素が存在する場合は、辞書データ省略部25は、当該変換を無効とし、変換前のデータ要素に戻すようにしてもよい。
辞書データ省略部25により省略辞書で変換されなかった部分については、上記第2の実施形態と同様に、単語分割部310、共通部分抽出部120および省略語作成部260により、省略データ要素に変換される。
なお、辞書データ省略部25は、単語分割後、または、共通部分抽出後に、抽出された共通部分および非共通部分について省略規則データに基づく変換を行ってよい。また、省略辞書記録部24は、コンピュータが備える記録装置またはコンピュータがアクセス外部記録装置等で実現される。省略辞書記録部24の省略規則データは、ユーザが自由に編集できるようにしてもよい。
また、省略語作成部が、省略規則データを自動的に生成する機能を備えてもよい。図10は、本実施形態における省略語作成部の変形例を示す機能ブロック図である。図10に示す例では、省略語作成部270は、省略規則生成部271と省略部272を備える。
省略規則生成部271は、例えば、上記表9に示した省略規則データと同様の形式の省略規則データを生成する。省略規則生成部271は、共通部分抽出部120が抽出した全データ間共通部分について削除または短縮を判断し、さらに全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて短縮するための省略規則を生成する。
例えば、上記第1の実施形態の省略制御部251と同様に、共通部分の長さに基づいて、共通部分の削除または短縮の判断、あるいは、短縮の仕方(短縮規則)の決定をすることができる。省略規則生成部271は、例えば、全データ間共通部分に関しては、閾値より長い場合は短縮、閾値より短い場合は削除と判断することができる。また、非共通部分に関しては、閾値より長い場合は先頭の2音節を残して短縮、閾値より短い場合は省略無しと判断することができる。省略規則生成部271は、このような判断に従った省略規則データを生成する。これにより、わかりやすい省略語の生成を可能にする省略規則を生成できる。
省略部272は、省略規則生成部271が生成した省略規則データに従って、共通部分または非共通部分を省略語に変換し、省略データ要素を生成する。なお、省略規則生成部271が生成した省略規則データは、省略辞書記録部24の省略規則データに追加登録されてもよい。
また、生成された省略規則データをユーザへ提示したり、ユーザが省略規則を指定したりすることを可能にする構成にすることもできる。図11は、そのような構成のデータ省略部2を示す機能ブロック図である。なお、図11に示すデータ省略部2において、項目データ抽出部21、識別可能データ抽出部22、辞書データ省略部25、単語分割部310および共通部分抽出部120は図9と同様であるので省略している。
図11に示す例では、データ省略部2は、省略規則出力部26、省略規則候補出力部27および省略規則指定部28を更に備える。省略語作成部280は、図10の変形例と同様に、省略規則生成部281および省略部282を備える。
省略規則出力部26は、省略規則生成部281が生成した省略規則データを、ユーザに提示する。例えば、ディスプレイの画面へ出力、プリンタ経由で紙面へ出力、またはスピーカから音声で出力等により省略規則をユーザに提示することができる。
省略規則指定部28は、削除を行うか否か、あるいは、短縮時にどの部分(先頭、中間、終端または先頭の単語等)を何文字または何音残すか等を示すパラメータ(短縮規則)を省略規則生成部281に指定する。これらのパラメータは、予め記録された値であってもよいし、ユーザがキーボード、マウス等の入力装置を介して指定することができる。
また、省略規則生成部281は、1つの省略対象に対して複数通りの省略規則を生成してもよい。例えば、表1の搬送元項目におけるデータ要素の省略規則の候補としては、全データ共通部分「物流センター」について、先頭2文字を残す「物流」、含まれる各単語の先頭2音を残す「物セン」、最後の単語を残す「センター」の3つの候補を省略規則の候補として生成する。この場合、省略規則候補出力部27は、省略規則生成部281が生成したいくつかの省略規則の候補をユーザに提示し、ユーザが所望の省略規則候補のうち、省略規則とすべきものを、省略規則指定部28を介して指定する構成となる。
[第4の実施形態]
図12は、本実施形態にかかる読み上げシステムの構成を示す機能ブロック図である。図12に示す読み上げシステム101は、音声合成装置10c、制御部5、ユーザインタフェース部4および読み合わせ対象データベース6を備える。読み上げシステム101は、例えば、PCまたはサーバマシンのようなコンピュータにより構成することができる。読み上げシステム101を構成するコンピュータには、スピーカ61、ディスプレイ62、キーボード63およびマウス64が接続されている。
図12に示す読み上げシステム101の音声合成装置10cにおいて、図5の音声合成装置10aと同じ機能ブロックには同じ番号を付す。音声合成装置10cは、読み合わせ対象データベース6から読み上げ対象データを読み込んで省略規則データを用いて省略データに変換し、その省略データが表す情報を読み上げる音声データを合成する。
ユーザインタフェース部4は、音声合成装置10cが読み込んだ読み上げ対象データ(入力データ)、音声合成装置10cで生成される省略データおよび音声合成装置10cで用いられる省略規則データ等が示す情報をディスプレイ62へ表示するためのユーザンタフェース機能を備える。また、ユーザインタフェース部4は、キーボード63およびマウス64を介してユーザから入力される情報を受け付けるユーザインタフェース機能も備える。これにより、ユーザが読み合わせ作業を効率的に行うことができる。
制御部5は、ユーザインタフェース部4が受け付けたユーザからの情報に基づいて、音声合成装置10cを制御し、読み合わせ対象データベースのデータを更新する。また制御部5は、音声合成装置10cからスピーカ61およびディスプレイ62へ出力する情報を取得して、出力可能な状態にしてユーザインタフェース部4へ渡し、出力を指示する。
具体的には、制御部5は、データ修正部51、表示制御部52および再生制御部53を備える。ユーザインタフェース部4は、入力データ修正インタフェース(入力データ修正IF)41、省略規則等選択・修正インタフェース(省略規則等選択・表示IF)42、入力データ表示インタフェース(入力データ表示IF)43、省略データ表示インタフェース(省略データ表示IF)44、省略規則表示インタフェース(省略規則表示IF)45、読み上げ箇所表示インタフェース(読み上げ箇所表示IF)46、読み上げ操作インタフェース(読み上げ操作IF)47および音声出力インタフェース(音声出力IF)48を備える。
以下、図12に示す読み上げシステム101における各機能部について、図13に示す表示画面例を参照しながら説明する。図13は、読み上げシステム101によりディスプレイ62に表示される画面の一例を示す図である。
音声合成装置10cのデータ入力部1が読み込んだ読み上げ対象データ(入力データ)は、表示制御部52、入力データ表示IF43を通じてディスプレイに表示される。図13に示す画面中のリストL1は、入力データ表示IF43による読み上げ対象データの表示例である。
音声合成装置10cの省略語規則生成部291は、上記第3の実施形態の省略規則生成部281と同様に、省略規則または省略規則の候補を示すデータを生成し、表示制御部52へ渡す。表示制御部52は、省略規則または省略規則の候補の表示位置等を決定し、省略規則表示IF45を介してディスプレイ62に表示させる。図13におけるリストL3は、省略規則表示IF45により表示される省略規則の例である。
音声合成装置10cの省略部292は、上記第3の実施形態の省略部282と同様に、省略規則生成部291が生成した省略規則データに従って、共通部分抽出部110が抽出したデータ要素の共通部分または非共通部分を省略語に変換し、省略データを生成する。省略データは、表示制御部52および省略データ表示IF44を介して、例えば、図13のリストL2に示すように、ディスプレイ62に表示される。
読み上げ操作IF47は、ユーザから読み上げ動作に関する指示を受け付ける。再生制御部53は、音声合成部3で合成された音声データが、読み合わせに適した順番で再生されるように、音声データの再生を制御する。また、読み上げ操作IF47が受け付けたユーザから指示に基づいて、音声合成部3が合成した音声データの再生を制御する。音声出力IF48は、再生制御部53からの指示に従い、スピーカ61へDA変換した音声データを出力する。
図13のボタン群B1は、ユーザが読み上げを操作するためのコントロールボタンの例である。ボタン群B1には、例えば、音声データの再生、停止、早送り、巻き戻し、前のデータへスキップ、後ろのデータへスキップを指示するコントロールボタンが含まれる。これにより、ユーザは、読み上げ対象データ(省略データ)の読み上げ開始、終了、誤りを発見した場合の読み上げの一時停止、その後の再生再開、直前、直後のデータ再生へのスキップ操作、行先頭や次の行へのスキップ操作など、所望の読み上げ箇所を読み上げさせることが可能になる。さらに、ユーザは、リストL1や、リストL2の任意のセルをマウス64で指定した後で、ボタンB1を操作することで、確認したい任意の入力データ要素および省略データ要素の音声を聞くことができる。また、読み上げ音声の速度や音量を調節するためのスライダを表示してもよい。これらのユーザからの指示は、読み上げ操作IF47が受け付け、再生制御部53に渡す。
また、再生制御部53は、読み上げ位置を提示するための制御を行う。表示制御部52から出力された読み上げ対象データおよびその表示位置を基に、現在再生している省略データ要素およびデータ要素の表示を他とは異なる形で表示するように、読み上げ箇所表示IF46上に指示する。
読み上げ箇所表示IF46は、音声合成装置10cへ入力されたデータ要素および音声合成装置10cで生成された省略データ要素の中で、現在再生されている(読み上げを行っている)省略データ要素および対応するデータ要素とそれらの表示位置を、再生制御部53から取得しユーザに示す。
例えば、図13に示すように、読み上げ箇所表示IF46は、リストL1およびリストL2において、再生中のデータ要素および省略データ要素の部分の背景色を変えて表示する(リストL1のセルS1、リストL2のセルS2)。なお、再生中のデータ要素および省略データ要素の表示箇所は、他とは異なる表示態様で表示されればよく、例えば、点滅表示されてもよい。
入力データ修正IF41は、キーボード63またはマウス64を介してユーザから読み上げ対象データの修正指示を受け付けて、データ修正部51に渡す。データ修正部51は、読み上げ対象データの修正指示に基づき、読み合わせ対象データベースに保持される該当するデータ要素を更新する。これにより、例えば、読み上げ対象データに誤りがあった場合にユーザは、読み上げ対象データを修正することができる。
例えば、図13のリストL1およびリストL2は、各データ要素が編集可能になっており、例えば、ユーザは、マウスカーソルC1で編集したいデータ要素または省略データ要素を指定し、キーボード63によりデータ要素の修正内容を入力することができる。これにより、ユーザは、読み上げ対象データに誤りを発見した場合に、マウスカーソルを修正したい箇所に持って行き、データ要素を編集することで、データベースに格納されている読み上げ対象データを編集、修正することができる。データが修正された場合、データ省略部2は、修正されたデータに基づき、再度省略データを生成する。なお、リストL2の省略データ要素が修正された場合、データ修正部51は、修正された省略データ要素の省略規則を逆引きし、修正された省略データ要素の省略前の表記を求め、読み合わせ対象データベースの内容を、省略前の表記で修正する。 同様に、省略規則等選択・修正IF42は、キーボード63またはマウス64を介してユーザから省略規則の修正または省略規則の候補の選択の指示を受け付けて、データ修正部51に渡す。データ修正部51は、ユーザの指示に基づいて省略規則データを修正し、修正された省略規則データを省略規則生成部291へ渡す。
例えば、図13のリストL3は、省略規則が編集可能になっている。リストL3には、省略規則として、省略前と省略後のデータが表示される。ユーザが省略規則を変更したい場合は、マウスカーソルC2を修正したい箇所に持って行き、省略規則を編集することもできる。
また、図13に示す例では、省略規則の印刷や、読み上げができるように、それらの制御ボタンB2も付与されている。ここで、音声合成装置を上記第3の実施形態に示したように省略辞書記録部を備える構成にした場合は、辞書記録部の省略規則データの表示および編集受け付けを行ってもよい。
省略規則等選択・修正IF42は、音声合成装置10cの省略規則生成部291が省略規則を生成する際のパラメータの指定をユーザから受け付ける。例えば、短縮時の短縮場所を示すパラメータや、何文字を残すかを示すパラメータ等の短縮規則のパラメータの指定を受け付けたり、省略規則生成部291が生成する省略規則の候補を、表示制御部52を介して取得し、ディスプレイ62にユーザが選択可能な状態で表示したりすることもできる。図13のプルダウンメニューP1は、単語を短縮する際に残す文字数を指定するためのプルダウンメニューの例である。
上記構成の読み上げシステムにより、表のように離散的に同一の言葉が表れるデータに対しても、読み上げ時間を短縮できる。また、項目内で互いに区別可能な程度に省略された省略語が読み上げられるため、確認作業者が目視するのは当該データのみで良く、かつ、現在の読み上げ位置を見失うこともないため、作業者の負担も軽減できる。
また、本願に開示する音声合成装置のデータ省略部は、項目毎のデータ要素を抽出する項目データ抽出部と、同一項目内のデータ要素間で共通している共通部分を抽出する共通部分抽出部と、共通部分を削除または短縮すること、あるいは、共通部分以外の非共通部分を短縮することにより、各項目内の互いに異なるデータ要素を、互いに区別可能な省略語を示す省略データ要素に変換する省略語作成部とを含む。このような構成によれば、共通部分を削除または短縮するという働きにより、必ず互いに他と区別可能で、かつ、省略されたデータ要素を得ることが期待できる。
また、本願に開示する音声合成装置のデータ省略部は、各データ要素を単語に分割する単語分割部をさらに備え、共通部分抽出部が同一項目に含まれるデータ要素間の共通部分を、単語単位で抽出し、省略語作成部は、抽出された共通部分の単語を削除または短縮、あるいは、非共通部分の単語を短縮することにより、データ要素を省略データ要素に変換する。このような構成によれば、削除、省略を、日本語として意味のまとまりのある単語単位で行うという働きにより、省略されたデータ要素も意味が理解し易い省略語となり、読み合わせをする際のユーザの負担を軽減することが期待できる。
また、本願に開示する音声合成装置のデータ省略部は、データ要素と、省略データ要素との関係を示す省略規則データを記録した省略辞書にアクセス可能であり、省略辞書に記録された省略規則データの示すデータ要素に対応するデータ要素が、データ入力部で入力されたデータに存在する場合は、省略規則データに従ってデータ要素を省略データ要素に変換する。このような構成によれば、自由に設定できる省略規則を記録した省略辞書の働きにより、ユーザがより分り易い省略語を設定でき、読み合わせをする際のユーザの負担をさらに軽減することが期待できる。
本願に開示する音声合成装置の共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、各項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、省略語作成部は、全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を判断して省略語を決定し、決定した省略語と省略前のデータ要素の情報との関係を示す省略規則データを生成する省略規則生成部と、省略規則生成部が生成した省略規則データに基づいて、データ要素を省略データ要素に変換する省略部とを含む。このような構成によれば、各項目内の一部のデータ要素において共通している一部データ間共通部分についても省略できるという働きにより、省略データをさらに短縮することが可能で、読み合わせをする際にかかる時間を短縮することが期待できる。
なお、本願に開示する音声合成装置の構成要素または構成要素の任意の組合せを、方法、装置、回路、システム、コンピュータプログラム、記録媒体、データ構造などに適用したものも、他の態様として有効である。
以上の第1〜第4の実施形態に関し、さらに以下の付記を開示する。
(付記1)
データで示される情報を読み上げるための音声合成装置であって、
読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部と、
データ入力部で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部と、
データ省略部で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部とを備える音声合成装置。
(付記2)
前記データ省略部は、
項目毎のデータ要素を抽出する項目データ抽出部と、
同一項目内のデータ要素間で共通している共通部分を抽出する共通部分抽出部と、
前記共通部分を削除または短縮すること、あるいは、前記共通部分以外の非共通部分を短縮することにより、各項目内の互いに異なるデータ要素を、互いに区別可能な省略語を示す省略データ要素に変換する省略語作成部とを含む、付記1記載の音声合成装置。
(付記3)
前記データ省略部は、
各データ要素を単語に分割する単語分割部をさらに備え、
前記共通部分抽出部が同一項目に含まれるデータ要素間の共通部分を、単語単位で抽出し、
前記省略語作成部は、抽出された共通部分の単語を削除または短縮、あるいは、非共通部分の単語を短縮することにより、前記データ要素を前記省略データ要素に変換する、付記2記載の音声合成装置。
(付記4)
前記データ省略部は、
前記データ要素と、省略データ要素との関係を示す省略規則データを記録した省略辞書にアクセス可能であり、
省略辞書に記録された省略規則データの示すデータ要素に対応するデータ要素が、前記データ入力部で入力されたデータに存在する場合は、前記省略規則データに従って当該データ要素を省略データ要素に変換する、付記1〜3のいずれか1項に記載の音声合成装置。
(付記5)
前記共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、各項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、
前記省略語作成部は、
前記全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を判断して省略語を決定し、決定した省略語と省略前のデータ要素の情報との関係を示す省略規則データを生成する省略規則生成部と、
前記省略規則生成部が生成した省略規則データに基づいて、前記データ要素を省略データ要素に変換する省略部とを含む、付記2に記載の音声合成装置。
(付記6)
前記省略規則生成部が生成した省略規則データをユーザに提示するために出力する省略規則出力部をさらに備える、付記5記載の音声合成装置。
(付記7)
省略規則の指定をユーザから受け付ける省略規則指定部をさらに備え、
前記省略規則生成部は、前記省略規則指定部が受け付けた省略規則の指定に基づいて、前記省略規則データを生成する、付記5記載の音声合成装置。
(付記8)
前記共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、当項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、
前記省略語作成部は、
前記全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を決定して省略語を生成することにより、データ要素を省略データ要素に変換する、付記2に記載の音声合成装置。
(付記9)
前記省略語作成部は、共通部分または非共通部分を短縮する際に、共通部分または非共通部分の長さに基づいて、適用する短縮規則を決定する、付記2に記載の音声合成装置。
(付記10)
データで示される情報を読み上げる読み上げシステムであって、
読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部と、
データ入力部で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部と、
データ省略部で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部と、
ユーザから入力される情報を取得し、ユーザに表示する情報を出力するユーザインタフェース部と、
前記ユーザインタフェース部で入力されたユーザからの情報に基づき、前記音声合成部で作成された音声データを再生する再生制御部と、
前記データの示す読み上げ対象の情報を、前記ユーザインタフェース部に出力させる表示制御部とを備える、読み上げシステム。
(付記11)
上記表示制御部は、前記再生制御部が音声データを再生する際に、再生中の音声データの省略データ要素に対応するデータ要素を示す情報を出力する、付記10に記載の読み上げシステム。
(付記12)
上記ユーザインタフェース部を介して、ユーザから前記データ要素の更新指示を受け付け、当該更新指示に基づいて、当該データ要素を更新する、データ修正部をさらに備える、付記10に記載の読み上げシステム。
(付記13)
データで示される情報を読み上げるための処理をコンピュータに実行させる音声合成プログラムであって、
読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力処理と、
データ入力処理で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略処理と、
データ省略処理で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成処理とをコンピュータに実行させる音声合成プログラム。
第1の実施形態にかかる音声合成装置の構成を示す機能ブロック図 第1の実施形態における音声合成装置の動作例を示すフローチャート 省略語作成部の構成の変形例を示す機能ブロック図 省略制御部の動作例を示すフローチャート 第2の実施形態にかかる音声合成装置の構成を示す機能ブロック図 第2の実施形態における省略語作成部の変形例を示す機能ブロック図 第2の実施形態における省略語作成部の他の変形例を示す機能ブロック図 第2の実施形態における省略語作成部のさらに他の変形例を示す機能ブロック図 第3の実施形態にかかる音声合成装置の構成を示す機能ブロック図 第3の実施形態における省略語作成部の変形例を示す機能ブロック図 第3の実施形態における省略語作成部の他の変形例を示す機能ブロック図 第4の実施形態にかかる読み上げシステムの構成を示す機能ブロック図 読み上げシステムによりディスプレイ62に表示される画面の一例を示す図
符号の説明
1 データ入力部
2 データ省略部
3 音声合成部
4 ユーザインタフェース部
5 制御部
6 読み合わせ対象データベース
10、10a〜10c 音声合成装置
21 項目データ抽出部
22 識別可能データ抽出部
24 省略辞書記録部
25 辞書データ省略部
26 省略規則出力部
27 省略規則候補出力部
28 省略規則指定部
41 入力データ修正IF
42 省略規則等選択・修正IF
43 入力データ表示IF
44 省略データ表示IF
45 省略規則表示IF
46 読み上げ箇所表示IF
47 読み上げ操作IF
48 音声出力IF
51 データ修正部
52 表示制御部
53 再生制御部
61 スピーカ
62 ディスプレイ
63 キーボード
64 マウス
100、110、120 共通部分抽出部
101 読み合わせシステム

200、210、220、230、240、250、260、270、280、290 省略語作成部
201、221、241 共通部分削除部
202、231 共通部分短縮部
203、243 非共通部分短縮部
211、251 省略制御部
212、252 削除部
213、253 短縮部
300、310 単語分割部
271、281、291 省略規則生成部
272、282、292 省略部

Claims (7)

  1. データで示される情報を読み上げるための音声合成装置であって、
    読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部と、
    データ入力部で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部と、
    データ省略部で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部とを備える音声合成装置。
  2. 前記データ省略部は、
    項目毎のデータ要素を抽出する項目データ抽出部と、
    同一項目内のデータ要素間で共通している共通部分を抽出する共通部分抽出部と、
    前記共通部分を削除または短縮すること、あるいは、前記共通部分以外の非共通部分を短縮することにより、各項目内の互いに異なるデータ要素を、互いに区別可能な省略語を示す省略データ要素に変換する省略語作成部とを含む、請求項1記載の音声合成装置。
  3. 前記データ省略部は、
    各データ要素を単語に分割する単語分割部をさらに備え、
    前記共通部分抽出部が同一項目に含まれるデータ要素間の共通部分を、単語単位で抽出し、
    前記省略語作成部は、抽出された共通部分の単語を削除または短縮、あるいは、非共通部分の単語を短縮することにより、前記データ要素を前記省略データ要素に変換する、請求項2記載の音声合成装置。
  4. 前記データ省略部は、
    前記データ要素と、省略データ要素との関係を示す省略規則データを記録した省略辞書にアクセス可能であり、
    省略辞書に記録された省略規則データの示すデータ要素に対応するデータ要素が、前記データ入力部で入力されたデータに存在する場合は、前記省略規則データに従って当該データ要素を省略データ要素に変換する、請求項1〜3のいずれか1項に記載の音声合成装置。
  5. 前記共通部分抽出部は、各項目内の全てのデータ要素において共通している全データ間共通部分と、各項目内の一部のデータ要素において共通している一部データ間共通部分とを抽出し、
    前記省略語作成部は、
    前記全データ間共通部分、一部データ間共通部分および非共通部分それぞれについて、削除または短縮を判断して省略語を決定し、決定した省略語と省略前のデータ要素の情報との関係を示す省略規則データを生成する省略規則生成部と、
    前記省略規則生成部が生成した省略規則データに基づいて、前記データ要素を省略データ要素に変換する省略部とを含む、請求項2記載の音声合成装置。
  6. データで示される情報を読み上げる読み上げシステムであって、
    読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力部と、
    データ入力部で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略部と、
    データ省略部で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成部と、
    ユーザから入力される情報を取得し、ユーザに表示する情報を出力するユーザインタフェース部と、
    前記ユーザインタフェース部で入力されたユーザからの情報に基づき、前記音声合成部で作成された音声データを再生する再生制御部と、
    前記データの示す読み上げ対象の情報を、前記ユーザインタフェース部に出力させる表示制御部とを備える、読み上げシステム。
  7. データで示される情報を読み上げるための処理をコンピュータに実行させる音声合成プログラムであって、
    読み上げ対象の情報を示すデータ要素が項目毎に分類されて構成されるデータを入力するデータ入力処理と、
    データ入力処理で入力されたデータの各項目に含まれるデータ要素が示す情報の一部を省略することによって、各項目内の互いに異なるデータ要素を、互いに区別可能な部分を残した省略データ要素に変換するデータ省略処理と、
    データ省略処理で変換された各省略データ要素の示す情報を読み上げるための音声データを作成する音声合成処理とをコンピュータに実行させる音声合成プログラム。
JP2008078616A 2008-03-25 2008-03-25 音声合成装置およびそれを用いた読み上げシステム。 Expired - Fee Related JP5082971B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008078616A JP5082971B2 (ja) 2008-03-25 2008-03-25 音声合成装置およびそれを用いた読み上げシステム。

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008078616A JP5082971B2 (ja) 2008-03-25 2008-03-25 音声合成装置およびそれを用いた読み上げシステム。

Publications (2)

Publication Number Publication Date
JP2009230062A true JP2009230062A (ja) 2009-10-08
JP5082971B2 JP5082971B2 (ja) 2012-11-28

Family

ID=41245491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008078616A Expired - Fee Related JP5082971B2 (ja) 2008-03-25 2008-03-25 音声合成装置およびそれを用いた読み上げシステム。

Country Status (1)

Country Link
JP (1) JP5082971B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013164870A1 (ja) * 2012-05-02 2013-11-07 三菱電機株式会社 音声合成装置
JP2014199580A (ja) * 2013-03-29 2014-10-23 富士通株式会社 略称生成方法および略称生成装置
JP2021182094A (ja) * 2020-05-20 2021-11-25 三菱電機株式会社 音声出力制御装置、音声出力制御方法および音声出力制御プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10288998A (ja) * 1997-04-14 1998-10-27 Just Syst Corp 表文書読み合わせ装置、表文書読み合わせ方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006023637A (ja) * 2004-07-09 2006-01-26 Canon Inc 音声応答装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10288998A (ja) * 1997-04-14 1998-10-27 Just Syst Corp 表文書読み合わせ装置、表文書読み合わせ方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006023637A (ja) * 2004-07-09 2006-01-26 Canon Inc 音声応答装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013164870A1 (ja) * 2012-05-02 2013-11-07 三菱電機株式会社 音声合成装置
JP5570675B2 (ja) * 2012-05-02 2014-08-13 三菱電機株式会社 音声合成装置
JP2014199580A (ja) * 2013-03-29 2014-10-23 富士通株式会社 略称生成方法および略称生成装置
JP2021182094A (ja) * 2020-05-20 2021-11-25 三菱電機株式会社 音声出力制御装置、音声出力制御方法および音声出力制御プログラム
JP7267234B2 (ja) 2020-05-20 2023-05-01 三菱電機株式会社 音声出力制御装置、音声出力制御方法および音声出力制御プログラム

Also Published As

Publication number Publication date
JP5082971B2 (ja) 2012-11-28

Similar Documents

Publication Publication Date Title
CN106716466B (zh) 会议信息储存装置以及方法
KR100591655B1 (ko) 음성 합성을 위한 음성 합성 방법, 음성 합성 장치 및 컴퓨터 판독 가능 기록 매체
US20090204399A1 (en) Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
JP6415929B2 (ja) 音声合成装置、音声合成方法およびプログラム
US20160027431A1 (en) Systems and methods for multiple voice document narration
US7603269B2 (en) Speech recognition grammar creating apparatus, control method therefor, program for implementing the method, and storage medium storing the program
JP6641045B1 (ja) コンテンツ生成システム、及びコンテンツ生成方法
JP2007295218A (ja) ノンリニア編集装置およびそのプログラム
JP5082971B2 (ja) 音声合成装置およびそれを用いた読み上げシステム。
JP2008083239A (ja) 中間言語編集装置、中間言語編集方法および中間言語編集プログラム
JP2005345699A (ja) 音声編集装置、音声編集方法および音声編集プログラム
JP7049173B2 (ja) 手話cg翻訳編集装置及びプログラム
JP2006236037A (ja) 音声対話コンテンツ作成方法、装置、プログラム、記録媒体
US10373606B2 (en) Transliteration support device, transliteration support method, and computer program product
JP6795996B2 (ja) 手話cg編集装置及びプログラム
JP5780726B2 (ja) 段組み処理装置、段組み処理方法、段組み処理プログラムおよびコンピュータ読み取り可能な記録媒体、ならびに、コンテンツ表示装置
JP2020140374A (ja) 電子図書再生装置及び電子図書再生プログラム
JP2004246129A (ja) 音声合成制御装置
JPH08272388A (ja) 音声合成装置及びその方法
JP2004258564A (ja) スコアデータ編集装置、スコアデータ表示装置およびプログラム
JP2015055793A (ja) 音声合成装置、音声合成方法、およびプログラム
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム
JP2002268664A (ja) 音声変換装置及びプログラム
KR102377038B1 (ko) 화자가 표지된 텍스트 생성 방법
US20240046035A1 (en) Program, file generation method, information processing device, and information processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120820

R150 Certificate of patent or registration of utility model

Ref document number: 5082971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees