JP6523998B2 - 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム - Google Patents

読み上げ情報編集装置、読み上げ情報編集方法およびプログラム Download PDF

Info

Publication number
JP6523998B2
JP6523998B2 JP2016050089A JP2016050089A JP6523998B2 JP 6523998 B2 JP6523998 B2 JP 6523998B2 JP 2016050089 A JP2016050089 A JP 2016050089A JP 2016050089 A JP2016050089 A JP 2016050089A JP 6523998 B2 JP6523998 B2 JP 6523998B2
Authority
JP
Japan
Prior art keywords
unit
condition
pattern
editing
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016050089A
Other languages
English (en)
Other versions
JP2017167219A (ja
Inventor
布目 光生
光生 布目
眞弘 森田
眞弘 森田
平 芦川
平 芦川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2016050089A priority Critical patent/JP6523998B2/ja
Priority to US15/428,701 priority patent/US10255904B2/en
Publication of JP2017167219A publication Critical patent/JP2017167219A/ja
Application granted granted Critical
Publication of JP6523998B2 publication Critical patent/JP6523998B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Description

本発明の実施形態は、読み上げ情報編集装置、読み上げ情報編集方法およびプログラムに関する。
近年、音声合成技術は、音質および話者性の向上に伴い、公共施設および公共交通機関でのナレーションをはじめ、エンターテインメントまたはシステムとの対話におけるインターフェース等、多くの場で利用されるようになっている。さらに、電子書籍等のテキストの読み上げ音声を自動化するなどの試みも行われてきている。
一般に、各種文書には、新語、未知語および固有名詞等の独特の言い回し、表現および表記等がある。音声合成技術で、そうした任意の自然文(漢字仮名混じり文)の読みおよびアクセントを、自動で常に正しく推定して音声として出力することは困難である。そのため、システムが読みおよびアクセントの指定を自動で行えない部分を、人手で修正する手法がよく用いられる。すなわち、音声合成機能による読み誤りおよびアクセント誤りが生じる個所に、人手で正しい読みおよびアクセントを指定しておくものである。
このような、音声合成機能を支援する技術として、文書内に出現する語の統計量、および合成音の音声認識結果テキスト等から、修正対象となる部分を順序付けてユーザへ提示させることにより、短時間かつ効率的に読み上げ音声を編集する技術が提案されている。しかしながら、読み上げ音声の編集の過程で、レビュー結果に沿って頻繁に修正したり、微調整する必要があっても、読み上げ音声の修正に伴う文書全体に対する影響範囲が認識できないため、修正作業の後戻りまたは見落としが発生する可能性があるという問題がある。
特開2014−240884号公報
本発明は、上記に鑑みてなされたものであって、テキストの音声合成についての編集に伴う文書内の影響範囲を特定することができる読み上げ情報編集装置、読み上げ情報編集方法およびプログラムを提供することを目的とする。
実施形態の読み上げ情報編集装置は、取得部と、解析部と、第1生成部と、第2生成部と、抽出部と、を備える。取得部は、文書から読み上げ情報が付加されたテキストを含む編集領域を取得する。解析部は、編集領域の文書構造を解析する。第1生成部は、文書構造に基づいて、編集領域を抽象化して1以上の条件パターンを生成する。第2生成部は、条件パターンのうち少なくとも1つを含み、文書からテキストを抽出するための抽出条件となる抽出条件を生成する。抽出部は、文書から、抽出条件に適合するテキストを抽出する。
読み上げ情報編集装置のハードウェア構成を示す図である。 読み上げ情報編集装置の機能ブロックの構成を示す図である。 入力文書の一例を示す図である。 テキストに対するメタデータの編集作業の一例を示す図である。 テキストに対する形態素解析の結果の一例を示す図である。 条件パターンの生成処理の一例を示すフローチャートである。 抽象度に応じて生成された条件パターンの一例を示す図である。 特定の条件パターンに適合するテキストの抽出結果の一例を示す図である。 抽出されたテキストについての差分を提示する例を示す図である。 抽出されたテキストについての差分を提示する別の例を示す図である。 読み上げ情報編集装置の全体動作を示すフローチャートである。
以下に、図面を参照しながら、本発明の実施形態に係る読み上げ情報編集装置、読み上げ情報編集方法およびプログラムを詳細に説明する。ただし、図面は模式的なものであるため、具体的な構成は以下の説明を参酌して判断すべきものである。
図1は、実施形態に係る読み上げ情報編集装置のハードウェア構成の一例を示す図である。図1を参照しながら、実施形態に係る読み上げ情報編集装置1のハードウェア構成について説明する。
図1に示すように、読み上げ情報編集装置1は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、補助記憶装置204と、表示装置205と、ネットワークI/F206と、操作装置207と、DVD(Digital Versatile Disk)ドライブ208と、スピーカ210(音声出力装置)と、を備えている。読み上げ情報編集装置1は、例えば、PC(Personal Computer)等の情報処理装置でもよく、テキストの音声合成に特化した専用装置であってもよい。
CPU201は、読み上げ情報編集装置1全体の動作を制御する装置である。ROM202は、CPU201が各機能を制御するために実行するBIOS(Basic Input/Output System)またはファームウェア等のプログラムを記憶する不揮発性記憶装置である。RAM203は、CPU201のワークエリアとして使用される揮発性記憶装置である。
補助記憶装置204は、各種データおよびプログラム等を記憶する不揮発性の記憶装置である。補助記憶装置204は、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等である。
表示装置205は、CPU201により実行されているアプリケーションの画面等を表示する装置である。表示装置205は、例えば、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、または有機EL(Electroluminescence)ディスプレイ等である。
ネットワークI/F206は、外部のネットワークに接続し、サーバ装置等の外部機器と通信する装置である。ネットワークI/F206は、例えば、NIC(Network Interface Card)等の通信装置である。ネットワークI/F206の通信プロトコルとして、例えば、TCP(Transmission Control Protocol)/IP(Internet Protocol)またはUDP(User Datagram Protocol)/IP等を適用できる。
操作装置207は、ユーザによってCPU11に対して所定の処理を実行させるための操作入力を行う装置である。操作入力とは、例えば、文字および数字等の入力、各種指示の選択操作の入力、およびカーソルの移動操作の入力等である。操作装置207は、例えば、マウス、キーボード、テンキー、タッチパッド、またはタッチパネル等の入力装置である。
DVDドライブ208は、着脱自在な記憶媒体であるDVD209に対するデータの読み出しまたは書き込み等の動作を制御する装置である。なお、上述の着脱可能な記録媒体の他の例として、CD−ROM(Compact Disc Read Only Memory)、CD−R(Compact Disc Recordable)、DVD−ROM、DVD―R(DVD Recordable)またはブルーレイディスク等のコンピュータで読み出しまたは書き込み可能な記録媒体であってもよい。
スピーカ210は、CPU201の制御に従って、音声を出力する装置である。
上述のCPU201、ROM202、RAM203、補助記憶装置204、表示装置205、ネットワークI/F206、操作装置207、DVDドライブ208、およびスピーカ210は、アドレスバスおよびデータバス等のバス211によって互いに通信可能に接続されている。
なお、読み上げ情報編集装置1のハードウェア構成は一例であり、図1に示す構成に限定されるものではない。例えば、DVDドライブ208以外に、フラッシュメモリ等の読み書きの制御を行うメディアドライブ等を備えていてもよい。
図2は、実施形態に係る読み上げ情報編集装置の機能ブロックの構成の一例を示す図である。図3は、入力文書の一例を示す図である。図4は、テキストに対するメタデータの編集作業の一例を示す図である。図5は、テキストに対する形態素解析の結果の一例を示す図である。図6は、実施形態に係る読み上げ情報編集装置による条件パターンの生成処理の一例を示すフローチャートである。図7は、抽象度に応じて生成された条件パターンの一例を示す図である。図8は、特定の条件パターンに適合するテキストの抽出結果の一例を示す図である。図9は、条件パターンの組み合わせにより抽出されたテキストについての差分を提示する例を示す図である。図10は、条件パターンの組み合わせにより抽出されたテキストについての差分を提示する別の例を示す図である。図2〜10を参照しながら、本実施形態に係る読み上げ情報編集装置1の機能ブロックの構成および動作について説明する。
図2に示すように、本実施形態に係る読み上げ情報編集装置1は、編集部101(第1編集部)と、編集領域取得部102(取得部)と、解析部103と、パターン生成部104(第1生成部)と、パターン選択部105(選択部)と、抽出メタルール生成部106(第2生成部)と、抽出部107と、差分検出部108(検出部)と、差分提示部109(出力制御部)と、入力部110と、記憶部111と、表示部112と、音声出力部113(出力部)と、を備えている。
編集部101は、ユーザによる入力部110に対する操作入力(以下、単に操作入力と称する場合がある)に基づいて、文書中のテキストに対して、読み上げのアクセント、ポーズおよび速度等の読み上げの装飾情報(以下、メタデータと称する場合がある)(読み上げ情報)を編集する機能部である。
例えば、図3に示す入力文書401における「1.空気抵抗の低減」というテキストに対してメタデータを付加(編集)する例について、図4を参照しながら説明する。まず、編集部101は、操作入力に基づいて、「1.空気抵抗の低減」というテキストを音声合成を用いて、聞き手によりわかりやすいように読み上げが行われるように、見出し番号の「1.」をデフォルトの速度よりも遅めに読み上げるための「速度−2」というメタデータを付加する。これによって、デフォルトの速度に対して2段階分遅めに読み上げられるという効果が加えられる。
次に、編集部101は、操作入力に基づいて、「空気抵抗の低減」というテキストを、聞き手の印象に残るようにやや遅めに読み上げが行われるように「速度−1」というメタデータを付加し、さらに、過度に抑揚をつけずにやや控えめな抑揚で読み上げが行われるように「ピッチ−1」というメタデータを付加する。さらに、編集部101は、操作入力に基づいて、「1.」および「空気抵抗の」の直後に短めの間(ショートポーズ)を入れるためのメタデータを付加し、落ちついた印象を与える読み上げが行われるようにする。
以上のような図4に示す編集作業例のように、編集部101によって、入力文書401のテキストに対するメタデータの編集作業が行われる。また、このようなメタデータは、例えば、SSML(Speech Synthesis Markup Language)等の合成音声を生成するための汎用的なタグ表記として表現されるほか、音声合成エンジンが解釈できるパラメータに変換されて保持される。なお、入力文書401は、例えば、入力部110を用いてユーザにより作成された文書、記憶部111に記憶された文書、または、図1に示すネットワークI/F206を介して受信した文書等であればよい。
編集領域取得部102は、操作入力に基づいて、入力文書401のテキストの中からメタデータが付加された領域のテキスト(編集領域)とメタデータとを含む編集内容を取得する機能部である。ここで、編集内容とは、編集領域およびメタデータの情報自体を含むと共に、入力文書401中において編集領域がどの位置にあり、どのようなメタデータが付加されたかについての情報等を含む。
解析部103は、編集領域取得部102により取得された編集内容に対して解析を行う機能部である。具体的には、解析部103は、編集内容に含まれる編集領域に対して形態素解析を行い、例えば、図5に示すような形態素解析の結果である素性情報を得る。図5に示す素性情報である「<数><記号><名><名>(の)<助詞><名>」は、入力文書401の「1.空気抵抗の低減」に対して形態素解析を行った結果である。すなわち、図5に示す素性情報は、「1.空気抵抗の低減」が、数詞、記号、名詞、名詞、「の」という助詞、名詞の順で構成されていることを示す。この素性情報は、後述するように、パターン生成部104による編集領域の抽象化のために利用される。
また、解析部103は、編集内容の解析によって、編集領域が入力文書401においてどの位置にあるか、何文字で構成されているか、箇条書きである場合、何項目であるか、先行する文書の構造、後続する文書の構造、直前のテキストの構造、直後のテキストの構造、および文字装飾等のような編集領域の属性を示す文書情報を取得する。
パターン生成部104は、解析部103の解析により得られた素性情報を利用して、編集領域を段階的に抽象化した1以上の条件パターンを生成する機能部である。ここで、条件パターンとは、編集領域のテキストがどのような構造で構成しているのかを示す抽象化されたパターンを示し、抽象化の度合い(抽象度)によりそのパターンに適合するテキストが異なってくる。
ここで、図6および7を参照しながら、パターン生成部104による条件パターンの生成処理について説明する。また、一部、解析部103による解析動作についても言及する。図7に示すように、編集領域から、抽象度が高くなる順にパターン(1)〜(5)の5つの条件パターンが生成される例について説明する。なお、図7では、元の編集領域である「1.空気抵抗の低減」を便宜上、パターン(0)として示している。
<ステップS11>
解析部103は、編集領域取得部102により取得された編集内容に含まれる表層表記である編集領域を読み込む。そして、ステップS12へ移行する。
<ステップS12>
解析部103は、編集領域に対して形態素解析を行う。例えば、解析部103は、編集領域が「1.空気抵抗の低減」であれば、上述の図5に示す形態素解析の結果である素性情報を得る。そして、ステップS13へ移行する。
<ステップS13>
パターン生成部104は、解析部103による形態素解析の結果である素性情報を利用し、「特定の品詞表記への置き換えを行う」という抽象化のルールに基づいて、編集領域を抽象化する。
例えば、パターン生成部104は、図7に示す編集領域「1.空気抵抗の低減」のうち、特定の品詞としての名詞を「<名>」に置き換える。すなわち、パターン生成部104は、「1.空気抵抗の低減」のうち名詞は「空気」、「抵抗」および「低減」なので、これらを「<名>」に置き換える。その結果、パターン生成部104は、図7に示すように、パターン(1)として「1.<名><名>”の”<名>」を生成する。パターン(1)では、数詞(番号)、記号、および助詞「の」が原文の表記を維持している。すなわち、パターン(1)は、「<名>」の部分が、名詞であればどのようなテキストでも受容するということを示す条件パターンとなる。ここで、上述の各条件パターンを生成するための抽象化のルールを、以下、「パターンルール」と称する場合がある。そして、ステップS14へ移行する。
<ステップS14>
パターン生成部104は、素性情報を利用して、「数詞を<数>に置き換え、記号を<記号>に置き換え、かつ、名詞の繰り返しを受容することを示すために名詞の後に『+』を付記する」というパターンルールに基づいて、パターン(1)をさらに抽象化する。
例えば、パターン生成部104は、図7に示すパターン(1)である「1.<名><名>”の”<名>」のうち、「1」を「<数>」に、記号である「.」を「<記号>」に置き換え、さらに、名詞の繰り返し表記を受容するための「+」を「<名>」の後に付記する。例えば、パターン(1)のうち「<名><名>」のように既に繰り返されている部分についても、「<名>+」のように置き換えることを意味する。その結果、パターン生成部104は、図7に示すように、パターン(2)として「<数><記号><名>+”の”<名>+」を生成する。パターン(2)では、助詞「の」のみが原文の表記を維持している。すなわち、パターン(2)は、「<数>」の部分が数詞のテキストを受容し、「<記号>」の部分が記号を示すテキストを受容し、かつ、「<名>+」の部分が名詞の繰り返し表記を受容することを示す条件パターンとなる。
次に、パターン生成部104は、素性情報を利用して、「助詞を<助詞>に置き換え、かつ、助詞と名詞との組の繰り返しを受容することを示すために『<助詞><名>』の後に『+』を付記する」というパターンルールに基づいて、パターン(2)をさらに抽象化する。
例えば、パターン生成部104は、図7に示すパターン(2)である「<数><記号><名>+”の”<名>+」のうち、「”の”」を「<助詞>」に置き換え、さらに、助詞と名詞との組の繰り返しを受容するための「+」を「<助詞><名>」の後に付記する。その結果、パターン生成部104は、図7に示すように、パターン(3)として「<数><記号><名>+(<助詞><名>)+」を生成する。すなわち、パターン(3)は、「<数>」の部分が数詞のテキストを受容し、「<記号>」の部分が記号を示すテキストを受容し、「<名>+」の部分が名詞の繰り返し表記を受容し、かつ、「(<助詞><名>)+」の部分が助詞と名詞との組の繰り返し表記を受容することを示す条件パターンとなる。そして、ステップS15へ移行する。
<ステップS15>
パターン生成部104は、「<数>等の特定表記を<カウンタ>に置き換え、かつ、<記号>の後にスペースの存在を受容することを示すためにスペースを挿入する」というパターンルールに基づいて、パターン(3)をさらに抽象化する。
例えば、パターン生成部104は、図7に示すパターン(3)である「<数><記号><名>+(<助詞><名>)+」のうち、特定表記である<数>を、上位化した<カウンタ>に置き換え、さらに、<記号>の後にスペースの存在を受容することを示すためにスペースを挿入する。その結果、パターン生成部104は、図7に示すように、パターン(4)として「<カウンタ><記号> <名>+(<助詞><名>)+」を生成する。すなわち、パターン(4)は、「<カウンタ>」の部分が、数詞だけでなく、例えば、アルファベット「a、b、c、・・・」、「あいうえお」および「アイウエオ」等の順序付き文字列を受容し、スペースの部分が、「<記号>」の後にスペースがあることを受容することを示す条件パターンとなる。そして、ステップS16へ移行する。
<ステップS16>
パターン生成部104は、「上述の特定表記以外の表記である<名>を<*>に置き換える」というパターンルールに基づいて、パターン(4)をさらに抽象化する。
例えば、パターン生成部104は、図7に示すパターン(4)である「<カウンタ><記号> <名>+(<助詞><名>)+」のうち、特定表記以外の表記である<名>を<*>に置き換える。その結果、パターン生成部104は、図7に示すように、パターン(5)として「<カウンタ><記号> <*>+(<助詞><*>)+」を生成する。パターン(5)は、例えば、「<*>」の部分が、名詞だけではなく、その他の品詞を受容することを示す条件パターンであるものとすればよい。そして、ステップS17へ移行する。
<ステップS17>
パターン生成部104は、ステップS16までで生成した条件パターン(図7の例では、パターン(5))で、さらに抽象化できる表記が存在するか確認する。抽象化できる表記が存在する場合(ステップS17:Yes)、ステップS14へ戻り、存在しない場合(ステップS17:No)、条件パターンの生成処理を終了する。
以上の図6に示すフローチャート(特に、ステップS13〜S17)のように、パターン生成部104による条件パターンの生成処理が行われ、段階的に抽象度の高い条件パターン(図7の例では、5段階の条件パターン)が生成される。このように、段階的に抽象度が高い複数の条件パターンが生成されるので、一般には、各条件パターンに適合するテキストは、条件パターンの抽象度が高くなるほど増えることになる。
なお、パターン生成部104により生成される条件パターンとして図7に示した条件パターンは一例であり、その他のパターンルールに基づいて、異なる数の条件パターンが生成されるものとしてもよい。また、パターン生成部104により生成される条件パターンは複数であることに限定されるものではなく、1つであってもよい。また、図7に示すような条件パターンを生成するためのパターンルールは一例であり、例えば、入力部110を介したユーザによる操作入力によって、パターンルールを編集できるものとしてもよい。例えば、編集領域または条件パターンをどのように抽象化するか、または、何段階に抽象化するか等を編集できるものとしてもよい。この場合、例えば、編集部101(第2編集部の一例)が、入力部110を介したユーザによる操作入力によって、パターンルールを編集するものとすればよい。
パターン選択部105は、操作入力に基づいて、パターン生成部104により生成された条件パターンのうち1以上の条件パターンを選択する機能部である。この場合、例えば、パターン生成部104は、生成した複数の条件パターンを表示部112に表示させ、ユーザは、表示部112に表示された条件パターンを確認し、表示された条件パターンのうち1以上の条件パターンを、入力部110を介して選択操作する。
なお、パターン選択部105は、操作入力に基づいて、選択した条件パターンを適用する範囲として、入力文書401における行番号もしくは行範囲を、入力文書401全体における前半部分もしくは後半部分、または、入力文書401を構成するページ単位での前半部分、後半部分、冒頭部分もしくは末尾部分等を指定可能であるものとしてもよい。または、パターン選択部105は、入力文書401に事前に付与されたり、または内在する文書構造情報に基づいて、選択した条件パターンを適用する範囲を指定するものとしてもよい。例えば、入力文書401が、XML(Extensible Markup Language)またはXHTML(Extensible HyperText Markup Language)等で記載された文書である場合、パターン選択部105は、XPath(XML Path Language)等による範囲指定方法に基づいて、選択した条件パターンを適用する範囲を指定するものとしてもよい。
また、パターン選択部105は、操作入力に基づいて、条件パターンを選択するのみならず、例えば、入力文書401において、抽出部107による抽出処理の適用範囲を選択することができるものとしてもよい。例えば、パターン選択部105は、操作入力に基づいて、入力文書401のうち抽出処理の対象となるページ範囲等を選択できるものとしてもよい。
抽出メタルール生成部106は、パターン選択部105により選択された1以上の条件パターンを含み、入力文書401からテキストを抽出するための抽出条件となる抽出メタルールを生成する機能部である。なお、パターン選択部105により、抽出部107の抽出処理の適用範囲が選択された場合は、その適用範囲を抽出条件として抽出メタルールに含まれるものとしてもよい。
抽出部107は、入力文書401から、抽出メタルール生成部106により生成された抽出メタルールに適合するテキストを抽出する機能部である。例えば、抽出メタルールが図7に示す条件パターンのうちパターン(3)により構成されている場合、抽出部107は、例えば、入力文書から、図8(a)に示す抽出表記501のようなパターン(3)に適合するテキストを抽出する。すなわち、抽出表記501に示すテキストは、それぞれ、箇条書き番号(数詞)に続いて閉じ括弧記号を含むテキストであり、パターン(3)により受容されるテキストであることを示す。また、抽出メタルールが図7に示す条件パターンのうちパターン(4)により構成されている場合、抽出部107は、例えば、入力文書から、図8(b)に示す抽出表記502のようなパターン(4)に適合するテキストを抽出する。すなわち、抽出表記502に示すテキストは、それぞれ、順序付き文字列(カウンタ)「a」〜「c」に続いて記号「.」を含むテキストであり、パターン(4)により受容されるテキストであることを示す。
また、抽出部107は、抽出したテキストが入力文書401中のどの位置にあるかを示す位置情報も抽出する。
差分検出部108は、抽出部107により抽出メタルールにより抽出したテキストにおいて、抽出メタルールが含むどの条件パターンにより抽出されたテキストであるかという差分を検出する機能部である。
差分提示部109は、抽出部107により抽出されたテキストおよび位置情報、ならびに、差分検出部108により検出された差分の情報に基づいて、入力文書401においてどの位置に、どの条件パターンに適合する、どのようなテキストが抽出されたかを、表示部112に表示させる機能部である。
例えば、図9に示す表示例は、入力文書401に対し、図7に示すパターン(2)およびパターン(3)の組を抽出メタルールとして、抽出部107により抽出されたテキストを示した例である。抽出部107は、入力文書401からパターン(2)に適合するテキストとして「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」および「2)不要重量物の除去」を抽出している。また、抽出部107は、入力文書401からパターン(3)に適合するテキストとして、「3)タイヤの空気圧の適正化」を抽出している。ただし、パターン(3)は、上述のようにパターン(2)をさらに抽象化した条件パターンであるので、上述の「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」および「2)不要重量物の除去」は、それぞれ、パターン(2)に適合すると共に、パターン(3)にも適合することになる。ただし、図9(および後述する図10)では、抽象度の低い条件パターンに適合したことを優先して示すように表示されるものとしている。
そして、差分検出部108は、抽出部107により抽出されたテキストのうち、「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」および「2)不要重量物の除去」がパターン(2)に適合するテキストであり、「3)タイヤの空気圧の適正化」がパターン(3)に適合するテキストであるという差分を検出する。そして、差分提示部109は、図9に示すように、例えば、パターン(3)に適合するテキストを、パターン(2)に適合するテキストよりも太字で表示させることにより、互いの差分を明確にする。なお、異なる条件パターンに適合するテキストを区別して表示させるためには、図9に示すように、テキストの文字の太さを変える方法に限定されるものではなく、例えば、テキストの大きさ、色、網掛け、またはハイライト等により視覚的に区別して表示するものとしてもよい。
さらに、差分提示部109は、抽出部107により抽出された位置情報を利用して、図9に示すように、ポインタ601aにより、「1)FRP軽量パーツの活用」および「2)不要重量物の除去」が、入力文書401の1ページ目から抽出されたことを示すようにしている。また、差分提示部109は、ポインタ601bにより、「2.ダウンフォースの増加」および「3.ウィングの機能」が、入力文書401の3ページ目から抽出されたことを示すようにしている。さらに、差分提示部109は、ポインタ602により、「3)タイヤの空気圧の適正化」が、入力文書401の1ページ目から抽出されたことを示すようにしている。
また、差分提示部109は、パターン(3)に適合するテキストである「3)タイヤの空気圧の適正化」の近傍に、読み上げ音声を出力するための音声再生用アイコン701を表示させている。差分提示部109は、操作入力により音声再生用アイコン701が押下されると、元の編集領域に付加されているメタデータと同じメタデータを「3)タイヤの空気圧の適正化」に適用した場合の読み上げ音声を、音声出力部113に出力させる。なお、図9に示す例では、音声再生用アイコンを「3)タイヤの空気圧の適正化」の近傍に配置させているが、これに限定されるものではなく、例えば、パターン(2)に適合するテキストの近傍に配置させてもよく、または、抽出されたすべてのテキストの近傍に配置させるものとしてもよい。
また、図10に示す表示例は、入力文書401に対し、図7に示すパターン(3)およびパターン(4)の組を抽出メタルールとして、抽出部107により抽出されたテキストを示した例である。抽出部107は、入力文書401からパターン(3)に適合するテキストとして「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」、「2)不要重量物の除去」および「3)タイヤの空気圧の適正化」を抽出している。また、抽出部107は、入力文書401からパターン(4)に適合するテキストとして、「a.周辺の環境整備」、「b.廃棄物の総量削減」および「c.エコグッズ利用の推進」を抽出している。ただし、パターン(4)は、上述のようにパターン(3)をさらに抽象化した条件パターンであるので、上述の「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」、「2)不要重量物の除去」および「3)タイヤの空気圧の適正化」は、それぞれ、パターン(3)に適合すると共に、パターン(4)にも適合することになる。ただし、図10では、図9と同様に、抽象度の低い条件パターンに適合したことを優先して示すように表示されるものとしている。
そして、差分検出部108は、抽出部107により抽出されたテキストのうち、「2.ダウンフォースの増加」、「3.ウィングの機能」、「1)FRP軽量パーツの活用」、「2)不要重量物の除去」および「3)タイヤの空気圧の適正化」がパターン(3)に適合するテキストであり、「a.周辺の環境整備」、「b.廃棄物の総量削減」および「c.エコグッズ利用の推進」がパターン(4)に適合するテキストであるという差分を検出する。そして、差分提示部109は、図10に示すように、例えば、パターン(4)に適合するテキストを、パターン(3)に適合するテキストよりも太字で表示させることにより、互いの差分を明確にする。
さらに、差分提示部109は、抽出部107により抽出された位置情報を利用して、図10に示すように、ポインタ611aにより、「1)FRP軽量パーツの活用」、「2)不要重量物の除去」および「3)タイヤの空気圧の適正化」が、入力文書401の1ページ目から抽出されたことを示すようにしている。また、差分提示部109は、ポインタ611bにより、「2.ダウンフォースの増加」および「3.ウィングの機能」が、入力文書401の3ページ目から抽出されたことを示すようにしている。さらに、差分提示部109は、ポインタ612により、「a.周辺の環境整備」、「b.廃棄物の総量削減」および「c.エコグッズ利用の推進」が、入力文書401の6ページ目から抽出されたことを示すようにしている。
また、差分提示部109は、パターン(4)に適合するテキストである「a.周辺の環境整備」、「b.廃棄物の総量削減」および「c.エコグッズ利用の推進」それぞれの近傍に、読み上げ音声を出力するための音声再生用アイコン711a〜711cをそれぞれ表示させている。差分提示部109は、例えば、操作入力により音声再生用アイコン711bが押下されると、元の編集領域に付加されているメタデータと同じメタデータを「b.廃棄物の総量削減」に適用した場合の読み上げ音声を、音声出力部113に出力させる。
そして、ユーザは、例えば上述の図9、10で示した差分提示部109により表示された内容を確認し、音声出力部113から出力される読み上げ音声を確認することによって、入力部110に対する操作入力および編集部101により、編集領域のメタデータを編集できるものとしてもよい。なお、メタデータの編集が可能なテキストは編集領域だけに限定されるものではなく、例えば、抽出されたテキストそれぞれに対してメタデータを編集することができるものとしてもよい。
そして、ユーザは、差分提示部109による表示から編集領域のメタデータが適用される範囲を確認した上で、操作入力により、差分提示部109に、抽出されたテキストに対して、編集領域のメタデータと同じメタデータを付加させる。
入力部110は、ユーザから操作入力を受け付ける機能部である。入力部110は、図1に示す操作装置207によって実現される。
記憶部111は、入力文書、メタデータ、音声データその他の各種データおよびプログラム等を記憶する機能部である。記憶部111は、図1に示す補助記憶装置204によって実現される。
表示部112は、CPU201により実行されているアプリケーションの画面等を表示する機能部である。例えば、表示部112は、図7に示したパターン生成部104により生成された条件パターン、または、図9および10に示した差分提示部109の機能による結果を表示する。表示部112は、図1に示す表示装置205によって実現される。
音声出力部113は、例えば、差分提示部109の指示に基づいて、音声を出力する機能部である。例えば、音声出力部113は、編集領域に付加されているメタデータと同じメタデータを、抽出部107により抽出されたテキストに適用した場合の読み上げ音声を出力する。音声出力部113は、図1に示すスピーカ210によって実現される。
上述の編集部101、編集領域取得部102、解析部103、パターン生成部104、パターン選択部105、抽出メタルール生成部106、抽出部107、差分検出部108および差分提示部109は、図1に示すCPU201が補助記憶装置204等に記憶されたプログラムをRAM203に読み出して実行することにより実現される。なお、編集部101、編集領域取得部102、解析部103、パターン生成部104、パターン選択部105、抽出メタルール生成部106、抽出部107、差分検出部108および差分提示部109は、すべてがプログラムの実行により実現されることに限定されるものではなく、少なくとも一部がASIC(Application Specific Integrated Circuit)またはFPGA(Field−Programmable Gate Array)等のハードウェア回路によって実現されるものとしてもよい。
また、図2に示す機能ブロックの構成は、機能を概念的に示したものであって、このような構成に限定されるものではない。例えば、図2で独立した機能部として図示した複数の機能部を、1つの機能部として構成してもよい。一方、図2の1つの機能部が有する機能を複数に分割し、複数の機能部として構成するものとしてもよい。
図11は、実施形態に係る読み上げ情報編集装置の全体動作の一例を示すフローチャートである。図11を参照しながら、本実施形態に係る読み上げ情報編集装置1の全体動作の流れを総括的に説明する。
<ステップS21>
編集部101は、ユーザによる入力部110に対する操作入力に基づいて、入力文書(例えば、図3に示す入力文書401)中のテキストに対して、読み上げのアクセント、ポーズおよび速度等の読み上げの装飾情報であるメタデータを編集する。そして、ステップS22へ移行する。
<ステップS22>
編集領域取得部102は、操作入力に基づいて、入力文書のテキストの中からメタデータが付加された領域のテキスト(編集領域)とメタデータとを含む編集内容を取得する。そして、ステップS23へ移行する。
<ステップS23>
解析部103は、編集領域取得部102により取得された編集内容に対して解析を行う。具体的には、解析部103は、編集内容に含まれる編集領域に対して形態素解析を行い、例えば、図5に示すような形態素解析の結果である素性情報を得る。そして、ステップS24へ移行する。
<ステップS24>
パターン生成部104は、解析部103の解析により得られた素性情報を利用して、編集領域を段階的に抽象化した条件パターンを生成する。例えば、パターン生成部104は、図7に示すように、編集領域から、抽象度が高くなる順にパターン(1)〜(5)の5つの条件パターンを生成する。パターン生成部104による条件パターンの生成処理の具体的な例は、図6に示すフローチャート(ステップS13〜S17)で上述した通りである。そして、ステップS25へ移行する。
<ステップS25>
パターン選択部105は、操作入力に基づいて、パターン生成部104により生成された条件パターンのうち1以上の条件パターンを選択する。そして、ステップS26へ移行する。
<ステップS26>
抽出メタルール生成部106は、パターン選択部105により選択された1以上の条件パターンであって、入力文書からテキストを抽出するための抽出条件となる抽出メタルールを生成する。そして、ステップS27へ移行する。
<ステップS27>
抽出部107は、入力文書から、抽出メタルール生成部106により生成された抽出メタルールに適合するテキストを抽出する。そして、ステップS28へ移行する。
<ステップS28>
差分検出部108は、抽出部107が抽出メタルールにより抽出したテキストにおいて、抽出メタルールが含むどの条件パターンにより抽出されたテキストであるかという差分を検出する。そして、ステップS29へ移行する。
<ステップS29>
差分提示部109は、抽出部107により抽出されたテキストおよび位置情報、ならびに、差分検出部108により検出された差分情報に基づいて、入力文書においてどの位置に、どの条件パターンに適合する、どのようなテキストが抽出されたかを、表示部112に表示(提示)させる。具体的な表示(提示)例については、図9および10で上述した通りである。
以上の図11に示すフローチャートで示すように、読み上げ情報編集装置1の全体動作が行われる。
以上のように、本実施形態に係る読み上げ情報編集装置1は、文書中のテキストにおいて、合成音声の読み上げの装飾情報(メタデータ)が付加された編集領域について、形態素解析を行い、その結果を用いて、編集領域を段階的に抽象化した1以上の条件パターンを生成する。そして、1以上の条件パターンを含む抽出メタルールに適合するテキストを抽出し、すなわち、編集領域と類似する文書構造(類似の程度は条件パターンの抽象度に基づく)を有するテキストを抽出することにより、編集領域に付加されたメタデータと同じメタデータを、抽出したテキストに適用することができる。一般に、音声合成で読み上げるための装飾情報をテキストに付加するためには、専用の記法があり、その習得には相当程度のスキルが必要である。また、複合語およびフレーズに対しては、アクセント句の分割および結合に関する知識も必要であり、直感的に読みおよびアクセントを指定することは、困難な場合がある。しかし、上述のように読み上げ情報編集装置1が構成されていることにより、編集領域に付加されたメタデータと同じメタデータを適用する場合の影響範囲を容易に認識することができ、さらに、その影響範囲のテキスト、すなわち、抽出メタルールに基づいて抽出されたテキストに、編集領域のメタデータと同じメタデータを一括で適用することができる。すなわち、編集領域と同様な文章構造を有するテキストに対して、一度に同じメタデータを適用することができるので、メタデータの編集作業の工数を削減することができ、さらに、編集の見落としも抑制することができる。
なお、読み上げ情報編集装置1は、図1および2に示すように1台にスタンドアロンの装置によって構成されるものとしたが、これに限定されるものではない。例えば、図2に示す機能部のうち、編集部101、編集領域取得部102、解析部103、パターン生成部104、パターン選択部105、抽出メタルール生成部106、抽出部107、差分検出部108、差分提示部109、および記憶部111を、サーバ装置が備えるものとし、入力部110、表示部112、および音声出力部113を、クライアント装置が備えるというようなクライアントサーバシステムで実現するものとしてもよい。
また、上述の実施形態の読み上げ情報編集装置1で実行されるプログラムは、例えば、ROM等に予め組み込まれて提供されるものとしてもよい。
また、上述の実施形態の読み上げ情報編集装置1で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
また、上述の実施形態の読み上げ情報編集装置1で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、上述の実施形態の読み上げ情報編集装置1で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
また、上述の実施形態の読み上げ情報編集装置1で実行されるプログラムは、コンピュータを上述した各機能部として機能させ得る。このコンピュータは、CPUがコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、および変更を行うことができる。この実施形態は、発明の範囲および要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 読み上げ情報編集装置
101 編集部
102 編集領域取得部
103 解析部
104 パターン生成部
105 パターン選択部
106 抽出メタルール生成部
107 抽出部
108 差分検出部
109 差分提示部
110 入力部
111 記憶部
112 表示部
113 音声出力部
201 CPU
202 ROM
203 RAM
204 補助記憶装置
205 表示装置
206 ネットワークI/F
207 操作装置
208 DVDドライブ
209 DVD
210 スピーカ
211 バス
401 入力文書
501、502 抽出表記
601a、601b、602 ポインタ
611a、611b、612 ポインタ
701、711a〜711c 音声再生用アイコン

Claims (11)

  1. 文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得部と、
    前記編集領域の文書構造を解析する解析部と、
    前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成部と、
    前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件を生成する第2生成部と、
    前記文書から、前記抽出条件に適合するテキストを抽出する抽出部と、
    を備えた読み上げ情報編集装置。
  2. 前記文書の読み上げ情報を編集する第1編集部を、さらに備えた請求項1に記載の読み上げ情報編集装置。
  3. 前記第1生成部は、前記編集領域を段階的に抽象化して複数の前記条件パターンを生成し、
    前記第2生成部は、2以上の前記条件パターンを含む前記抽出条件を生成し、
    前記抽出部により抽出されたテキストそれぞれが適合する前記条件パターンの差分を検出する検出部と、前記抽出部により抽出されたテキストを、前記差分が明示されるように表示装置に出力させる出力制御部と、をさらに備えた請求項1に記載の読み上げ情報編集装置。
  4. 前記出力制御部は、前記差分に基づいて、前記抽出部により異なる前記条件パターンで抽出されたテキストをそれぞれ視覚的に異なるように前記表示装置に出力させる請求項3に記載の読み上げ情報編集装置。
  5. 前記取得部は、さらに前記編集領域に付加された前記読み上げ情報を取得し、
    前記出力制御部は、前記抽出部により抽出されたテキストのうち少なくともいずれかのテキストに対して、前記編集領域の前記読み上げ情報を適用した場合の読み上げ音声を音声出力装置に出力させる請求項3に記載の読み上げ情報編集装置。
  6. 前記条件パターンは、前記編集領域のテキストの文書構造を示す抽象化したパターンである請求項1に記載の読み上げ情報編集装置。
  7. 前記第1生成部は、前記編集領域を段階的に抽象化して複数の前記条件パターンを生成し、
    前記第1生成部により生成された複数の前記条件パターンから1以上の前記条件パターンを選択する選択部を、さらに備え、
    前記第2生成部は、前記選択部により選択された前記条件パターンを含む前記抽出条件を生成する請求項1に記載の読み上げ情報編集装置。
  8. 前記第1生成部は、前記編集領域に含まれる連番の記号または数字をカウンタ要素として同一種別とする抽象化、前記編集領域の同じ品詞のテキストを同一種別とする抽象化、および、前記編集領域において1種以上の品詞の繰り返しを受容することによる抽象化のうち少なくともいずれかの抽象化に基づいて前記条件パターンを生成する請求項1に記載の読み上げ情報編集装置。
  9. 前記編集領域を抽象化するための規則であるパターンルールを編集する第2編集部を、さらに備え、
    前記第1生成部は、前記編集領域を前記パターンルールに従って抽象化して、前記条件パターンを生成する請求項1に記載の読み上げ情報編集装置。
  10. 文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得ステップと、
    前記編集領域の文書構造を解析する解析ステップと、
    前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成ステップと、
    前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件となる抽出条件を生成する第2生成ステップと、
    前記文書から、前記抽出条件に適合するテキストを抽出する抽出ステップと、
    を有する読み上げ情報編集方法。
  11. コンピュータを、
    文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得部と、
    前記編集領域の文書構造を解析する解析部と、
    前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成部と、
    前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件となる抽出条件を生成する第2生成部と、
    前記文書から、前記抽出条件に適合するテキストを抽出する抽出部と、
    として機能させるためのプログラム。
JP2016050089A 2016-03-14 2016-03-14 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム Expired - Fee Related JP6523998B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016050089A JP6523998B2 (ja) 2016-03-14 2016-03-14 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム
US15/428,701 US10255904B2 (en) 2016-03-14 2017-02-09 Reading-aloud information editing device, reading-aloud information editing method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016050089A JP6523998B2 (ja) 2016-03-14 2016-03-14 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2017167219A JP2017167219A (ja) 2017-09-21
JP6523998B2 true JP6523998B2 (ja) 2019-06-05

Family

ID=59787038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016050089A Expired - Fee Related JP6523998B2 (ja) 2016-03-14 2016-03-14 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム

Country Status (2)

Country Link
US (1) US10255904B2 (ja)
JP (1) JP6523998B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021152696A (ja) * 2020-03-24 2021-09-30 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN118280342B (zh) * 2024-05-31 2024-08-09 贵阳朗玛信息技术股份有限公司 一种朗读流式Markdown文本并跟踪显示朗读进度的方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3076047B2 (ja) 1989-07-26 2000-08-14 日本電気株式会社 ポーズ挿入位置決定装置
JPH1152973A (ja) 1997-08-07 1999-02-26 Ricoh Co Ltd 文書読み上げ方式
JP2001100781A (ja) * 1999-09-30 2001-04-13 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
US6865533B2 (en) 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
US20040054535A1 (en) * 2001-10-22 2004-03-18 Mackie Andrew William System and method of processing structured text for text-to-speech synthesis
JP4551066B2 (ja) 2003-07-14 2010-09-22 ブラザー工業株式会社 音声合成装置、音声合成方法及び音声合成プログラム
JP4478939B2 (ja) * 2004-09-30 2010-06-09 株式会社国際電気通信基礎技術研究所 音声処理装置およびそのためのコンピュータプログラム
KR100669241B1 (ko) * 2004-12-15 2007-01-15 한국전자통신연구원 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
US8447610B2 (en) * 2010-02-12 2013-05-21 Nuance Communications, Inc. Method and apparatus for generating synthetic speech with contrastive stress
JP2012198277A (ja) 2011-03-18 2012-10-18 Toshiba Corp 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム
JP6127371B2 (ja) * 2012-03-28 2017-05-17 ヤマハ株式会社 音声合成装置および音声合成方法
GB2505400B (en) * 2012-07-18 2015-01-07 Toshiba Res Europ Ltd A speech processing system
JP2014240884A (ja) * 2013-06-11 2014-12-25 株式会社東芝 コンテンツ作成支援装置、方法およびプログラム
JP6411015B2 (ja) * 2013-09-12 2018-10-24 富士通株式会社 音声合成装置、音声合成方法、およびプログラム
JP6290230B2 (ja) * 2013-10-10 2018-03-07 株式会社東芝 音訳作業支援装置、音訳作業支援方法及びプログラム
US9589183B2 (en) * 2013-11-22 2017-03-07 Parchment, Inc. System and method for identification and extraction of data
JPWO2015162737A1 (ja) 2014-04-23 2017-04-13 株式会社東芝 音訳作業支援装置、音訳作業支援方法及びプログラム
JP6392445B2 (ja) * 2015-03-24 2018-09-19 株式会社東芝 音訳支援装置、音訳支援方法及び音訳支援プログラム
US10042846B2 (en) * 2016-04-28 2018-08-07 International Business Machines Corporation Cross-lingual information extraction program
WO2018131048A1 (en) * 2017-01-11 2018-07-19 Satyanarayana Krishnamurthy System and method for natural language generation

Also Published As

Publication number Publication date
US20170263238A1 (en) 2017-09-14
JP2017167219A (ja) 2017-09-21
US10255904B2 (en) 2019-04-09

Similar Documents

Publication Publication Date Title
US11176141B2 (en) Preserving emotion of user input
US8396714B2 (en) Systems and methods for concatenation of words in text to speech synthesis
US8355919B2 (en) Systems and methods for text normalization for text to speech synthesis
US8712776B2 (en) Systems and methods for selective text to speech synthesis
JP2007206317A (ja) オーサリング方法、オーサリング装置およびプログラム
US9304987B2 (en) Content creation support apparatus, method and program
US7801722B2 (en) Techniques for customization of phonetic schemes
JP2008083952A (ja) 辞書作成支援システム、方法及びプログラム
JP2016099741A (ja) 情報抽出支援装置、方法およびプログラム
US10089975B2 (en) Transliteration work support device, transliteration work support method, and computer program product
Cassidy et al. Tools for multimodal annotation
TW200842662A (en) Stroke number input
JP6523998B2 (ja) 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム
US20130080163A1 (en) Information processing apparatus, information processing method and computer program product
JP2005031259A (ja) 自然言語処理方法
US10373606B2 (en) Transliteration support device, transliteration support method, and computer program product
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
JP5975033B2 (ja) 音声合成装置、音声合成方法および音声合成プログラム
JP4341077B2 (ja) 文書処理装置、文書処理方法、および、文書処理プログラム
JP2005011382A (ja) 特許明細書の作成方法
JP2015055793A (ja) 音声合成装置、音声合成方法、およびプログラム
JP7280055B2 (ja) 歌唱発音文字列自動補正プログラム及び歌唱発音文字列自動補正装置
US20240005906A1 (en) Information processing device, information processing method, and information processing computer program product
JP5262190B2 (ja) 入力補完装置、及び入力補完プログラム
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190426

R151 Written notification of patent or utility model registration

Ref document number: 6523998

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees