JPWO2017179164A1 - 読み上げルール修正装置、読み上げルール修正方法 - Google Patents

読み上げルール修正装置、読み上げルール修正方法 Download PDF

Info

Publication number
JPWO2017179164A1
JPWO2017179164A1 JP2018511830A JP2018511830A JPWO2017179164A1 JP WO2017179164 A1 JPWO2017179164 A1 JP WO2017179164A1 JP 2018511830 A JP2018511830 A JP 2018511830A JP 2018511830 A JP2018511830 A JP 2018511830A JP WO2017179164 A1 JPWO2017179164 A1 JP WO2017179164A1
Authority
JP
Japan
Prior art keywords
reading
correction
rule
information
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018511830A
Other languages
English (en)
Inventor
直哉 杉谷
直哉 杉谷
充 海老原
充 海老原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2017179164A1 publication Critical patent/JPWO2017179164A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

本発明は、ユーザの意思に沿って読み上げルールを修正することを目的とする。本発明に係る読み上げルール修正装置は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部(2A)と、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部(6)と、修正指示に従い読み上げ情報を修正する読み上げ情報修正部(7)と、読み上げ情報修正部の修正に基づき、読み上げルールを修正する読み上げルール修正部(8)と、を備える。

Description

本発明は、テキストの読み上げルールを修正する技術に関する。
テキストの読み上げ音声を出力するテキスト読み上げ装置がある。テキスト読み上げ装置によれば、ユーザは、テキストの読み上げ音声を聞くことによりテキストを理解することが出来る。従って、テキスト読み上げ装置は、例えばカーナビゲーション装置等、ユーザが表示画面を長時間視認することが難しい場面で使用が想定される装置の情報出力手段として有用である。
テキスト読み上げ装置は、音声合成エンジンを用いて読み上げ音声を作成する。音声合成エンジンは、読み上げルールに従って、入力されたテキスト文字列を音声に変換している。読み上げルールとは、テキストの読み方を決定するルールのことであり、例えば単語の読み方を決定するルールがこれに該当する。
読み上げルールは、大抵、音声合成エンジンに固有のものであるが、これを固定とするのではなく、ユーザの嗜好を反映させる等して、より良い読み方が出来るように適宜改善していくことが求められている。
例えば、特許文献1では、テキストから抽出した固有表現の発音の仕方を変える音声合成方法が提案されている。特許文献1の音声合成方法によれば、例えば、電話番号、人名、地名、金額、または日時などの固有表現は、通常の発音とは異なり一音一音をはっきりと発音させることにより、聞き間違いを防止している。
特開2004−246085号公報
しかし、特許文献1のように、事前に読み上げるべきテキストから固有表現を抽出する方法によれば、事前の抽出から漏れた固有表現については、ユーザの意図に沿って適切に読み上げることが出来ない。
本発明は上述の問題に鑑み、ユーザの意思に沿って読み上げルールを修正することを目的とする。
本発明に係る読み上げルール情報修正装置は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部と、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部と、当該修正指示に従い読み上げ情報を修正する読み上げ情報修正部と、読み上げ情報の修正に基づき読み上げルールを修正する読み上げルール修正部と、を備える。
本発明に係る読み上げルール修正方法は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、ユーザによる読み上げ情報の修正指示を取得し、修正指示に従い読み上げ情報を修正し、読み上げ情報の修正に基づき読み上げルールを修正する。
本発明に係る読み上げルール情報修正装置は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部と、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部と、当該修正指示に従い読み上げ情報を修正する読み上げ情報修正部と、読み上げ情報の修正に基づき読み上げルールを修正する読み上げルール修正部と、を備える。従って、ユーザの意図に沿って読み上げルールを修正することができる。
本発明に係る読み上げルール修正方法は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、ユーザによる読み上げ情報の修正指示を取得し、修正指示に従い読み上げ情報を修正し、読み上げ情報の修正に基づき読み上げルールを修正する。従って、ユーザの意図に沿って読み上げルールを修正することができる。
本発明の目的、特徴、態様、および利点は、以下の詳細な説明と添付図面とによって、より明白となる。
実施の形態1に係る読み上げルール修正装置の構成を示すブロック図である。 実施の形態1に係る読み上げルール修正装置の動作を示すフローチャートである。 実施の形態2に係るテキスト読み上げ装置の構成を示すブロック図である。 読み上げルールを例示する図である。 ユーザの操作による読み上げ情報の修正を説明するための図である。 修正後の読み上げルールを例示する図である。 実施の形態2に係るテキスト読み上げ装置の動作を示すフローチャートである。 実施の形態2に係るテキスト読み上げ装置の動作を示すフローチャートである。 実施の形態3に係るテキスト読み上げ装置の構成を示すブロック図である。 サーバと複数の実施の形態3に係るテキスト読み上げ装置との接続関係を示す図である。 実施の形態1に係る読み上げルール修正装置、実施の形態2に係るテキスト読み上げ装置、および実施の形態3に係るテキスト読み上げ装置のハードウェア構成を示す図である。 実施の形態1に係る読み上げルール修正装置、実施の形態2に係るテキスト読み上げ装置、および実施の形態3に係るテキスト読み上げ装置のハードウェア構成を示す図である。
<A.実施の形態1>
図1は、本発明の実施の形態1に係る読み上げルール修正装置11の構成を示すブロック図である。読み上げルール修正装置11は、テキストの読み上げ情報を、ユーザの修正指示に基づき修正し、修正した読み上げ情報に基づき読み上げルールを修正する。読み上げルール修正装置11は、本発明に必須の構成を含んでおり、図1に示すように、読み上げ情報取得部2A、読み上げルール修正部8、読み上げ情報修正部7、および修正指示取得部6を備えている。
読み上げ情報取得部2Aは、テキストの読み上げ情報を取得する。読み上げ情報とは、読み上げるべきテキストの読み方を示す情報である。言語によっては、テキストを構成する各文字列は複数の読み方を有しており、テキストからはその読み方が一意に定まらない場合がある。例えば、テキスト“St. Stephen”において、“St.”は“Saint”の略称でも“Street”の略称でもあるため、テキスト“St. Stephen”からはその読み方が一意に定まらない。そこで、「St.をSaintと読む」という読み上げルールに基づき、テキスト“St. Stephen”を読み上げ情報“Saint Stephen”に変換することにより、読み上げが可能となる。
読み上げルールは、上記の例における「St.をSaintと読む」等のように、単語の読み方に関する情報を含んでおり、読み上げるべきテキストを読み上げ情報に変換するルールを定めている。読み上げルールは、上記の例では、単語の省略形の読み方を定めるルールであるが、その他、アクセント、抑揚、強勢、ポーズ等のテキストの読み方に関するルールを定めていても良い。
読み上げルールは、読み上げルール格納部5に格納されている。読み上げルール格納部5は、読み上げルール修正装置11と有線又は無線で接続されており、読み上げルール修正装置11は読み上げルール格納部5に格納された情報の読み出しおよび修正が可能である。なお、図1では読み上げルール格納部5を読み上げルール修正装置11の外部構成として示しているが、読み上げルール修正装置11が読み上げルール格納部5を利用出来ればよいため、読み上げルール格納部5は読み上げルール修正装置11が備えていても良い。
修正指示取得部6は、ユーザから読み上げ情報の修正指示を取得する。修正指示取得部6は、具体的には、機械的なスイッチ類またはタッチパネルによって実現される入力インタフェースから読み上げ情報の修正指示を取得する。あるいは、修正指示取得部6は、スマートフォンまたはパーソナルコンピュータ等の外部機器と有線又は無線で通信し、外部機器に対するユーザの入力を通信により取得する。
読み上げ情報修正部7は、読み上げ情報取得部2Aから読み上げ情報を取得し、修正指示取得部6からユーザの修正指示を取得する。そして、ユーザの修正指示に基づき、読み上げ情報を修正する。
読み上げルール修正部8は、読み上げ情報修正部7の修正に基づき、読み上げルール格納部5に格納された読み上げルールを修正する。
図2は、読み上げルール修正装置11の動作を示すフローチャートである。まず、読み上げ情報取得部2Aが読み上げ情報を取得する(ステップS1)。次に、修正指示取得部6がユーザの修正指示を取得する(ステップS2)。次に、読み上げ情報修正部7が、ステップS2で取得した修正指示に基づき、ステップS1で取得した読み上げ情報を修正する(ステップS3)。最後に、読み上げルール修正部8が、ステップS1で取得した読み上げ情報の作成元となった読み上げルールを、ステップS3の修正に基づき修正し、読み上げルール格納部5に格納する(ステップS4)。
すなわち、読み上げルール修正装置11は、読み上げルール格納部5に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部2Aと、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部6と、修正指示に従い読み上げ情報を修正する読み上げ情報修正部7と、読み上げ情報修正部7の修正に基づき、読み上げルールを修正する読み上げルール修正部8と、を備える。従って、ユーザの意思を反映して読み上げルールが修正されるため、ユーザの意図に沿った読み上げルールを作成することができる。
また、実施の形態1に係る読み上げルール修正方法によれば、単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、ユーザによる読み上げ情報の修正指示を取得し、修正指示に従い読み上げ情報を修正し、読み上げ情報の修正に基づき読み上げルールを修正する。従って、ユーザの意思を反映して読み上げルールが修正されるため、ユーザの意図に沿った読み上げルールを作成することができる。
<B.実施の形態2>
実施の形態2では、本発明の読み上げルール修正装置を、テキスト読み上げ装置に適用した例を説明する。
図3は、実施の形態2に係るテキスト読み上げ装置12の構成を示すブロック図である。図3では、図1に示した実施の形態1の構成と同一又は対応する構成には同一の参照符号を付している。テキスト読み上げ装置12は、実施の形態1に係る読み上げルール修正装置11の構成と比較すると、音声合成エンジン3および音声出力制御部4を新たに備えており、読み上げ情報取得部2Aに代えて、構文解析部1およびテキスト変換部2を備えている。
構文解析部1は、読み上げるべきテキストを取得し、当該テキストの構文解析を行う。構文解析とは、例えば、テキスト“I am waiting by St. Stephen’s Church.”を、“I”“am”“waiting”“by”“St.”“Stephen’s”“Church”と単語単位に分解することをいう。
テキスト変換部2は、読み上げルール格納部5の読み上げルールを参照して、構文解析部1から取得した構文解析結果に基づき、テキストを読み上げ情報に変換する。具体的には、構文解析結果“I”“am”“waiting”“by”“St.”“Stephen’s”“Church”のうち、“St.”の読み方が一意に定まらないため、テキスト変換部2は、読み上げルール格納部5の読み上げルールを参照して“St.”の読み方を取得する。
図4は、読み上げルール格納部5に格納された読み上げルールを例示する図である。図4に示すように、“St.”の読み方は“Street”であり、他の読み方の候補として“saint”、“Step”、“Summer time”、“Store accumulator”が格納されている。従って、テキスト変換部2は、“St.”の読み方として“Street”を採用し、テキスト“I am waiting by St. Stephen’s Church.”を読み上げ情報“I am waiting by Street Stephen’s Church.”に変換する。
テキスト変換部2で作成した読み上げ情報は、音声合成エンジン3と読み上げ情報修正部7に入力される。音声合成エンジン3は、テキスト変換部2から取得した読み上げ情報に基づき、音声合成により読み上げ音声を作成する。音声合成エンジン3は、読み上げ情報に従いテキストの読み上げ音声を作成する音声作成部の例示である。音声合成エンジン3が作成した読み上げ音声は音声出力制御部4に入力され、音声出力制御部4がスピーカ21を制御して読み上げ音声を出力する。こうして、スピーカ21から“I am waiting by Street Stephen’s Church.”と音声が出力される。
図5は、ユーザの操作による読み上げ情報の修正を説明するための図である。図5では、テキスト読み上げ装置12がスピーカ21とディスプレイ22を備えている様を示しているが、勿論、図3に示したようにこれらは別体であっても良い。図5(a)に示すように、テキスト読み上げ装置12がテキスト“I am waiting by St. Stephen’s Church.”を“I am waiting by Street Stephen’s Church.”と読み上げたとする。このとき、ディスプレイ22には読み上げ中のテキストが表示されている。ユーザは“St.”を“Saint”と読んで欲しいと考えているとすると、直ちに「修正」と発話する。
修正指示取得部6は、ユーザの発話を音声認識することにより、ユーザから修正指示が入力されていると判断し、修正指示ありとの通知を読み上げ情報修正部7に行う。
読み上げ情報修正部7は、テキスト変換部2からテキストの読み上げ情報を取得する。すなわち、読み上げ情報修正部7は、テキスト変換部2から読み上げ情報を取得する読み上げ情報取得部として機能する。そして、読み上げ情報修正部7は、ユーザの修正指示に沿って読み上げ情報を修正する。具体的には、まず、読み上げ情報修正部7は、修正指示取得部6から修正指示ありとの通知を受けた直前に読み上げていたテキストの読み上げ情報の中から修正範囲を特定し、ディスプレイ22に表示する。図5(b)では、テキストの修正範囲を下線で示している。
修正範囲の特定方法の一例として、読み上げ情報修正部7は、読み上げルールにおいて読み方の他の候補が規定されている単語を修正範囲と特定することができる。図4に例示した読み上げルールでは、テキスト“I am waiting by St. Stephen’s Church.”を構成する単語のうち、“St.”には“Saint”または“Step”等が“Street”以外の他の候補として存在するため、読み上げ情報修正部7は“St.”の読み上げ情報“Street”を修正範囲と特定する。
読み上げ情報修正部7は、読み上げルール格納部5から“St.”の読み方の他候補を取得し、それらを修正候補としてディスプレイ22にリスト表示する。図5(b)では、「1.Saint 2.Step 3.Summer time」という修正候補がディスプレイ22に表示されている。
ユーザは候補リストの中から一つの候補を選択する。例えば、ユーザが「1」と発話すると、修正指示取得部6がユーザの発話を音声認識し、“St.”の読み方として「Saint」が選択されたことを読み上げ情報修正部7に通知する。
なお、候補リストの中にユーザの望む読み方が無い場合、ユーザは自分で正しい読み方を指定しても良い。例えば図5(c)では、「1.Store accumulator 2.Step 3.Summer time」という候補リストがディスプレイ22に表示されており、ユーザの望む読み方“Saint”が提示されていない。そこで、ユーザは「自分で指定」と発話し、続けて“Saint”と発話する。修正指示取得部6は、ユーザの発話を音声認識し、「自分で指定」の後に発話された読み方“Saint”が“St.”の読み方として指定されたことを読み上げ情報修正部7に通知する。
読み上げ情報修正部7は、修正指示取得部6から“St.”の読み方として「Saint」が選択または指定された旨の通知を受けると、読み上げ情報“I am waiting by Street Stephen’s Church”を“I am waiting by Saint Stephen’s Church”と修正する。この修正した読み上げ情報に基づき音声合成エンジン3で音声信号が作成され、図5(d)に示すように、スピーカ21から“I am waiting by Saint Stephen’s Church”と読み上げが行われる。
読み上げルール修正部8は、読み上げ情報修正部7における読み上げ情報の修正に基づき、読み上げルールを修正する。テキスト“I am waiting by St. Stephen’s Church.”の読み上げ情報が“I am waiting by Street Stephen’s Church.”から“I am waiting by Saint Stephen’s Church.”に変更されたことに基づき、読み上げルール修正部8は、テキスト“St.”の読み方を“Saint”とする読み上げルールに修正する。そして、“Street”は“St.”の読み方の他の候補とする。図6は、修正後の読み上げルールを示している。
読み上げルール修正部8で修正した読み上げルールは読み上げルール格納部5に格納される。こうして、ユーザの指示に沿って読み上げルールが修正される。次回からの読み上げでは、この修正された読み上げルールを基にテキスト変換部2がテキストを読み上げ情報に変換するので、ユーザの意図に沿って“St.”を“Saint”と読み上げることができる。このように、読み上げルール格納部5に格納される読み上げルールは、修正を繰り返すほど、ユーザの嗜好に沿った読み上げルールとして確立されていく。
なお、図5に示した読み上げ情報の修正指示方法は、あくまでも一例である。例えば、読み上げルールにおいて読み方の他の候補が存在する単語を修正範囲と特定すると説明したが、該当する単語が複数存在する場合には、それら全ての単語について、順番に修正候補のリストをユーザに提示しても良い。
また、ユーザが「修正」と発話した直前のテキストから修正範囲を特定すると述べたが、直前のテキストから修正範囲が特定できなければ、一つ前のテキストから修正範囲を特定する等、順に前のテキストに遡って修正範囲を特定しても良い。
また、ユーザの修正指示の入力方法として、発話による入力方法を説明した。発話による入力方法によれば、ユーザは画面を見ずに入力を行うことができるため、テキスト読み上げ装置12がカーナビゲーション装置等の車載装置に適用される場合に有効であるが、これは一例に過ぎない。別の方法として、ディスプレイ22に表示したテキストから、タッチアンドドラッグ等の入力操作によって修正範囲を指定し、正しい読み方を入力しても良い。
また、図4に示す読み上げルールでは、単語単体でその読み方を特定した。しかし、例えば、“St. Stephen”のように“St.”の後に名詞が続く場合には“St.”を「セイント」と読むというように、単語の前後関係を考慮して読み方を特定しても良い。
また、読み上げ情報の修正候補の提示方法は、図5に示すリスト表示に限らず、例えば修正候補を音声で出力しても良い。
図7および図8は、テキスト読み上げ装置12の動作を示すフローチャートである。以下、図7および図8に沿ってテキスト読み上げ装置12の動作を説明する。テキスト読み上げ装置12の動作は、例えばテキスト読み上げ装置12に読み上げるべきテキストが入力されることによって開始する。まず、構文解析部1がテキストの構文解析を行う(ステップS11)。次に、テキスト変換部2が構文解析部1における構文解析結果に基づきテキストを読み上げ情報に変換する(ステップS12)。読み上げ情報への変換は、読み上げルール格納部5に格納されている読み上げルールを参照して行われる。
次に、ステップS12で作成された読み上げ情報を基に、音声合成エンジン3が音声合成によりテキストの読み上げ音声信号を作成する。また、読み上げ音声信号は音声合成エンジン3から音声出力制御部4に出力される。そして、音声出力制御部4がスピーカ21を制御して読み上げ音声を出力する(ステップS13)。
次に、修正指示取得部6がユーザから読み上げ情報の修正指示を取得したか否かを判断する(ステップS14)。修正指示取得部6が読み上げ情報の修正指示を取得しなかった場合は、読み上げ情報を修正することなく処理を終了する。一方、修正指示取得部6が読み上げ情報の修正指示を取得した場合は、読み上げ情報修正部7が修正範囲を決定し(ステップS15)、修正範囲をディスプレイ22に表示する(ステップS16)。さらに、読み上げ情報修正部7は読み上げ情報の修正候補をディスプレイ22に表示する(ステップS17)。
次に、ユーザが読み上げ情報の修正指示を行うと、修正指示取得部6が修正指示内容を読み上げ情報修正部7に通知し、読み上げ情報修正部7が修正指示内容に基づき読み上げ情報を修正する(ステップS18)。次に、ステップS18で修正された読み上げ情報を基に、音声合成エンジン3が音声合成によりテキストの読み上げ音声信号を作成する。また、読み上げ音声信号は音声合成エンジン3から音声出力制御部4に出力される。そして、音声出力制御部4がスピーカ21を制御して読み上げ音声を出力する(ステップS19)。
次に、読み上げルール修正部8がステップS18の読み上げ情報の修正を基に読み上げルールの修正を行い、修正した読み上げルールを読み上げルール格納部5に格納し(ステップS20)、テキスト読み上げ装置12の動作が終了する。なお、図8のフローチャートにおいて、ステップS19とステップS20は順不同である。
以上に説明したように、実施の形態2に係る読み上げルール修正装置であるテキスト読み上げ装置12は、実施の形態1の読み上げルール修正装置11の構成に加えて、読み上げ情報に従いテキストの読み上げ音声を作成する音声作成部としての音声合成エンジン3と、テキストの読み上げ音声の出力制御を行う音声出力制御部4と、を備える。従って、ユーザはテキストの読み上げ音声を聞いて、読み上げ情報を修正すべきか否かを判断することができる。
また、読み上げ情報修正部7は、複数の修正候補の中からユーザが選択した修正候補により読み上げ情報を修正するため、容易に読み上げ情報を修正することができる。
また、読み上げ情報修正部7は、ユーザの音声入力に基づき読み上げ情報を修正するので、ユーザは発話音声により読み上げ情報の修正指示を行うことができる。特に、テキスト読み上げ装置12がカーナビゲーション装置等の車載装置である場合には、ユーザは画面を見ることなく読み上げ情報の修正指示を行うことができるため、運転しながらの操作が可能となり、有用である。
<C.実施の形態3>
図9は、実施の形態3に係るテキスト読み上げ装置13の構成を示すブロック図である。テキスト読み上げ装置13は、読み上げルール格納部24が配置された外部のサーバ23と接続されており、それ以外の点では実施の形態2のテキスト読み上げ装置12と同様である。
読み上げルール修正部8は、読み上げ情報修正部7における読み上げ情報の修正に基づき修正した読み上げルールを、読み上げルール格納部5と、サーバ23の読み上げルール格納部24の両方に格納する。テキスト変換部2は、読み上げルール格納部24ではなく、読み上げルール格納部5に格納された読み上げルールを参照してテキストを読み上げ情報に変換する。
図10に示すように、サーバ23には複数のテキスト読み上げ装置13が接続されており、読み上げルール格納部24には、複数のテキスト読み上げ装置13から読み上げルールが追加される。従って、読み上げルール格納部24には、複数のユーザが修正した読み上げルールが格納される。
読み上げ情報修正部7は、読み上げルール格納部5だけでなく、サーバ23の読み上げルール格納部24を参照して、読み上げ情報の修正を行う。例えば、読み上げルール格納部24に複数の読み方が存在するテキストを修正範囲と特定することが出来る。また、修正候補をユーザに提示する際には、読み上げルール格納部24に格納された読み上げルールで示された読み方を修正候補として提示することで、他のユーザが使用している読み上げルールを修正候補に用いることができる。
また、読み上げルール格納部24では、使用するユーザ数の多い順に、読み上げルールをソートして格納しておき、より多くのユーザに使用されている読み上げルールの読み方を優先的に修正候補として提示することも可能である。
従って、ユーザは読み上げルール格納部24から他のユーザの読み上げルールを参照しつつ、読み上げルール格納部5の読み上げルールを自分の嗜好に沿って修正することができる。
以上に説明したように、実施の形態3にかかる読み上げルール修正装置としてのテキスト読み上げ装置13において、読み上げルール修正部8で修正した読み上げルールはサーバ23に格納され、読み上げ情報修正部7はサーバ23から読み上げ情報の修正候補を取得する。サーバ23に複数のテキスト読み上げ装置13を接続すれば、サーバ23には各テキスト読み上げ装置13から修正した読み上げルールが蓄積される。従って、サーバ23から修正候補を取得することで、各テキスト読み上げ装置13のユーザは、他のユーザの修正した読み上げルールを利用して読み上げルールを修正することが可能となる。
<D.ハードウェア構成>
図11は、上記で説明した実施の形態1に係る読み上げルール修正装置11、実施の形態2に係るテキスト読み上げ装置12、および実施の形態3に係るテキスト読み上げ装置13を実現するハードウェア構成を示している。図11に示されるように、読み上げルール修正装置11、テキスト読み上げ装置12、およびテキスト読み上げ装置13は、処理回路31およびメモリ32により実現される。すなわち、実施の形態1においては、処理回路31が読み上げ情報取得部2A、読み上げルール修正部8、読み上げ情報修正部7、および修正指示取得部6を備え、メモリ32が読み上げルール格納部5を備える。また、実施の形態2および実施の形態3においては、処理回路31が構文解析部1、テキスト変換部2、音声合成エンジン3、音声出力制御部4、読み上げルール修正部8、読み上げ情報修正部7、および修正指示取得部6を備え、メモリ32が読み上げルール格納部5を備える。
処理回路31には、専用のハードウェアでも良いし、図12に示すように、メモリ32に格納されるプログラムを実行するプロセッサ33により構成されても良い。プロセッサ33は、例えば中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、Digital Signal Processor等である。
処理回路31が専用のハードウェアである場合、処理回路31は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、またはこれらを組み合わせたものが該当する。読み上げルール修正装置11、テキスト読み上げ装置12および13の各部の機能は、まとめて一つの処理回路31で実現されてもよいし、各部の機能それぞれが複数の処理回路で実現されてもよい。
処理回路31がプロセッサ33である場合、読み上げ情報修正部7等の機能は、ソフトウェア等(ソフトウェア、ファームウェアまたはソフトウェアとファームウェア)との組み合わせにより実現される。ソフトウェア等はプログラムとして記述され、メモリ32に格納される。図12に示すように、処理回路31に適用されるプロセッサ33は、メモリ32に記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、読み上げルール修正装置11、テキスト読み上げ装置12、およびテキスト読み上げ装置13は、処理回路31により実行されるときに、読み上げ情報を取得するステップと、ユーザによる読み上げ情報の修正指示を取得するステップと、修正指示に従い読み上げ情報を修正するステップと、読み上げ情報修正部の修正に基づき読み上げルールを修正するステップと、が結果的に実行されることになるプログラムを格納するためのメモリ32を備える。換言すれば、このプログラムは、読み上げ情報修正部7等の手順や方法をコンピュータに実行させるものであるともいえる。ここで、メモリ32には、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Electrically Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)などの、不揮発性または揮発性の半導体メモリ、HDD(Hard Disk Drive)、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD(Digital Versatile Disk)及びそのドライブ装置の少なくともいずれか1つが含まれる。
以上、読み上げ情報修正部7等の各機能が、ハードウェア及びソフトウェア等のいずれか一方で実現される構成について説明した。しかしこれに限ったものではなく、読み上げ情報修正部7等の一部を専用のハードウェアで実現し、別の一部をソフトウェア等で実現する構成であってもよい。例えば、読み上げ情報修正部7については専用のハードウェアとしての処理回路でその機能を実現し、それ以外についてはプロセッサ33としての処理回路31がメモリ32に格納されたプログラムを読み出して実行することによってその機能を実現することが可能である。
以上のように、処理回路31は、ハードウェア、ソフトウェア等、またはこれらの組み合わせによって、上述の各機能を実現することができる。
また、読み上げルール修正装置11は車載装置等の一つの装置であっても良いし、例えば車載装置、Portable Navigation Device、通信端末(例えば携帯電話、スマートフォン、およびタブレットなどの携帯端末)、およびこれらにインストールされるアプリケーションの機能、並びにサーバなどを適宜に組み合わせて構築されるシステムにも適用することができる。この場合、以上で説明した読み上げルール修正装置11の各機能または各構成要素は、システムを構築する各機器に分散して配置されてもよいし、いずれかの機器に集中して配置されてもよい。上記の構成に関する変形例は、テキスト読み上げ装置12およびテキスト読み上げ装置13にも同様に適用される。
なお、本発明は、その発明の範囲内において、各実施の形態および各変形例を自由に組み合わせたり、各実施の形態および各変形例を適宜、変形または省略したりすることが可能である。
本発明は詳細に説明されたが、上記した説明は全ての態様において例示であり、本発明がそれに限定されるものではない。例示されていない無数の変形例が、本発明の範囲から外れることなく想定され得る。
1 構文解析部、2 テキスト変換部、2A 読み上げ情報取得部、3 音声合成エンジン、4 音声出力制御部、5,24 読み上げルール格納部、6 修正指示取得部、7 読み上げ情報修正部、8 読み上げルール修正部、11 読み上げルール修正装置、12,13 テキスト読み上げ装置、21 スピーカ、22 ディスプレイ、23 サーバ、31 処理回路、32 メモリ、33 プロセッサ。
本発明に係る読み上げルール情報修正装置は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部と、ユーザの発話を音声認識することにより、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部と、当該修正指示に従い読み上げ情報を修正する読み上げ情報修正部と、読み上げ情報の修正に基づき読み上げルールを修正する読み上げルール修正部と、を備える。
本発明に係る読み上げルール修正方法は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、ユーザの発話を音声認識することにより、ユーザによる読み上げ情報の修正指示を取得し、修正指示に従い読み上げ情報を修正し、読み上げ情報の修正に基づき読み上げルールを修正する。
本発明に係る読み上げルール情報修正装置は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部と、ユーザの発話を音声認識することにより、ユーザによる読み上げ情報の修正指示を取得する修正指示取得部と、当該修正指示に従い読み上げ情報を修正する読み上げ情報修正部と、読み上げ情報の修正に基づき読み上げルールを修正する読み上げルール修正部と、を備える。従って、ユーザの意図に沿って読み上げルールを修正することができる。
本発明に係る読み上げルール修正方法は、読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、ユーザの発話を音声認識することにより、ユーザによる読み上げ情報の修正指示を取得し、修正指示に従い読み上げ情報を修正し、読み上げ情報の修正に基づき読み上げルールを修正する。従って、ユーザの意図に沿って読み上げルールを修正することができる。

Claims (6)

  1. 読み上げルール格納部に格納された単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得する読み上げ情報取得部と、
    ユーザによる前記読み上げ情報の修正指示を取得する修正指示取得部と、
    前記修正指示に従い前記読み上げ情報を修正する読み上げ情報修正部と、
    前記読み上げ情報の修正に基づき、前記読み上げルールを修正する読み上げルール修正部と、を備える、
    読み上げルール修正装置。
  2. 前記読み上げ情報に従い前記テキストの読み上げ音声を作成する音声作成部と、
    前記テキストの読み上げ音声の出力制御を行う音声出力制御部と、をさらに備える、
    請求項1に記載の読み上げルール修正装置。
  3. 前記読み上げ情報修正部は、複数の修正候補の中からユーザが選択した修正候補により前記読み上げ情報を修正する、
    請求項1に記載の読み上げルール修正装置。
  4. 前記読み上げ情報修正部は、ユーザの音声入力に基づき、前記読み上げ情報を修正する、
    請求項1に記載の読み上げルール修正装置。
  5. 前記読み上げルール修正部が修正した読み上げルールはサーバに格納され、
    前記読み上げ情報取得部は、前記サーバに格納された読み上げルールから読み上げ情報の修正候補を取得する、
    請求項3に記載の読み上げルール修正装置。
  6. 単語の読み方に関する情報を含む読み上げルールに従い作成された、複数の単語を含むテキストの読み方を示す読み上げ情報を取得し、
    ユーザによる前記読み上げ情報の修正指示を取得し、
    前記修正指示に従い前記読み上げ情報を修正し、
    前記読み上げ情報の修正に基づき前記読み上げルールを修正する、
    読み上げルール修正方法。
JP2018511830A 2016-04-14 2016-04-14 読み上げルール修正装置、読み上げルール修正方法 Pending JPWO2017179164A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/061973 WO2017179164A1 (ja) 2016-04-14 2016-04-14 読み上げルール修正装置、読み上げルール修正方法

Publications (1)

Publication Number Publication Date
JPWO2017179164A1 true JPWO2017179164A1 (ja) 2018-07-26

Family

ID=60042155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018511830A Pending JPWO2017179164A1 (ja) 2016-04-14 2016-04-14 読み上げルール修正装置、読み上げルール修正方法

Country Status (2)

Country Link
JP (1) JPWO2017179164A1 (ja)
WO (1) WO2017179164A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09325787A (ja) * 1996-05-30 1997-12-16 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JP2003302989A (ja) * 2002-04-11 2003-10-24 Denso Corp 情報端末、サーバ及びプログラム
JP2007248886A (ja) * 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置
JP2015118222A (ja) * 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ 音声合成システム及び音声合成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09325787A (ja) * 1996-05-30 1997-12-16 Internatl Business Mach Corp <Ibm> 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
JP2003302989A (ja) * 2002-04-11 2003-10-24 Denso Corp 情報端末、サーバ及びプログラム
JP2007248886A (ja) * 2006-03-16 2007-09-27 Mitsubishi Electric Corp 読み修正装置
JP2015118222A (ja) * 2013-12-18 2015-06-25 株式会社日立超エル・エス・アイ・システムズ 音声合成システム及び音声合成方法

Also Published As

Publication number Publication date
WO2017179164A1 (ja) 2017-10-19

Similar Documents

Publication Publication Date Title
USRE49762E1 (en) Method and device for performing voice recognition using grammar model
TWI509595B (zh) 用於名稱發音之系統與方法
JP6570651B2 (ja) 音声対話装置および音声対話方法
CN111369971B (zh) 语音合成方法、装置、存储介质和电子设备
KR102443087B1 (ko) 전자 기기 및 그의 음성 인식 방법
TWI508033B (zh) 語言學習方法與裝置以及電腦可讀記錄媒體
US7742924B2 (en) System and method for updating information for various dialog modalities in a dialog scenario according to a semantic context
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
CN109326284B (zh) 语音搜索的方法、装置和存储介质
JP2018097029A (ja) 音声認識装置および音声認識方法
JP2014202848A (ja) テキスト生成装置、方法、及びプログラム
JP2020027132A (ja) 情報処理装置およびプログラム
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
KR101562222B1 (ko) 발음의 정확도 평가 장치 및 그 방법
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
WO2017179164A1 (ja) 読み上げルール修正装置、読み上げルール修正方法
JP5701348B2 (ja) 音声認識装置、音声認識方法、およびプログラム
JP2017187797A (ja) テキスト生成装置、方法、及びプログラム
JP2017198790A (ja) 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム
JP7038919B2 (ja) 多言語音声認識装置および多言語音声認識方法
JP2019053251A (ja) 情報処理装置、言語判定方法及びプログラム
US10937412B2 (en) Terminal
JP2007171275A (ja) 言語処理装置及び現後処理方法
JP2011237741A (ja) 音声認識装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190319

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190625