JP6523998B2 - 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム - Google Patents
読み上げ情報編集装置、読み上げ情報編集方法およびプログラム Download PDFInfo
- Publication number
- JP6523998B2 JP6523998B2 JP2016050089A JP2016050089A JP6523998B2 JP 6523998 B2 JP6523998 B2 JP 6523998B2 JP 2016050089 A JP2016050089 A JP 2016050089A JP 2016050089 A JP2016050089 A JP 2016050089A JP 6523998 B2 JP6523998 B2 JP 6523998B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- condition
- pattern
- editing
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000000605 extraction Methods 0.000 claims description 84
- 238000004458 analytical method Methods 0.000 claims description 34
- 238000001514 detection method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 description 23
- 238000003860 storage Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 15
- 230000009467 reduction Effects 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000000877 morphologic effect Effects 0.000 description 10
- 239000002245 particle Substances 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000005457 optimization Methods 0.000 description 9
- 238000005034 decoration Methods 0.000 description 6
- 239000002699 waste material Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
解析部103は、編集領域取得部102により取得された編集内容に含まれる表層表記である編集領域を読み込む。そして、ステップS12へ移行する。
解析部103は、編集領域に対して形態素解析を行う。例えば、解析部103は、編集領域が「1.空気抵抗の低減」であれば、上述の図5に示す形態素解析の結果である素性情報を得る。そして、ステップS13へ移行する。
パターン生成部104は、解析部103による形態素解析の結果である素性情報を利用し、「特定の品詞表記への置き換えを行う」という抽象化のルールに基づいて、編集領域を抽象化する。
パターン生成部104は、素性情報を利用して、「数詞を<数>に置き換え、記号を<記号>に置き換え、かつ、名詞の繰り返しを受容することを示すために名詞の後に『+』を付記する」というパターンルールに基づいて、パターン(1)をさらに抽象化する。
パターン生成部104は、「<数>等の特定表記を<カウンタ>に置き換え、かつ、<記号>の後にスペースの存在を受容することを示すためにスペースを挿入する」というパターンルールに基づいて、パターン(3)をさらに抽象化する。
パターン生成部104は、「上述の特定表記以外の表記である<名>を<*>に置き換える」というパターンルールに基づいて、パターン(4)をさらに抽象化する。
パターン生成部104は、ステップS16までで生成した条件パターン(図7の例では、パターン(5))で、さらに抽象化できる表記が存在するか確認する。抽象化できる表記が存在する場合(ステップS17:Yes)、ステップS14へ戻り、存在しない場合(ステップS17:No)、条件パターンの生成処理を終了する。
編集部101は、ユーザによる入力部110に対する操作入力に基づいて、入力文書(例えば、図3に示す入力文書401)中のテキストに対して、読み上げのアクセント、ポーズおよび速度等の読み上げの装飾情報であるメタデータを編集する。そして、ステップS22へ移行する。
編集領域取得部102は、操作入力に基づいて、入力文書のテキストの中からメタデータが付加された領域のテキスト(編集領域)とメタデータとを含む編集内容を取得する。そして、ステップS23へ移行する。
解析部103は、編集領域取得部102により取得された編集内容に対して解析を行う。具体的には、解析部103は、編集内容に含まれる編集領域に対して形態素解析を行い、例えば、図5に示すような形態素解析の結果である素性情報を得る。そして、ステップS24へ移行する。
パターン生成部104は、解析部103の解析により得られた素性情報を利用して、編集領域を段階的に抽象化した条件パターンを生成する。例えば、パターン生成部104は、図7に示すように、編集領域から、抽象度が高くなる順にパターン(1)〜(5)の5つの条件パターンを生成する。パターン生成部104による条件パターンの生成処理の具体的な例は、図6に示すフローチャート(ステップS13〜S17)で上述した通りである。そして、ステップS25へ移行する。
パターン選択部105は、操作入力に基づいて、パターン生成部104により生成された条件パターンのうち1以上の条件パターンを選択する。そして、ステップS26へ移行する。
抽出メタルール生成部106は、パターン選択部105により選択された1以上の条件パターンであって、入力文書からテキストを抽出するための抽出条件となる抽出メタルールを生成する。そして、ステップS27へ移行する。
抽出部107は、入力文書から、抽出メタルール生成部106により生成された抽出メタルールに適合するテキストを抽出する。そして、ステップS28へ移行する。
差分検出部108は、抽出部107が抽出メタルールにより抽出したテキストにおいて、抽出メタルールが含むどの条件パターンにより抽出されたテキストであるかという差分を検出する。そして、ステップS29へ移行する。
差分提示部109は、抽出部107により抽出されたテキストおよび位置情報、ならびに、差分検出部108により検出された差分情報に基づいて、入力文書においてどの位置に、どの条件パターンに適合する、どのようなテキストが抽出されたかを、表示部112に表示(提示)させる。具体的な表示(提示)例については、図9および10で上述した通りである。
101 編集部
102 編集領域取得部
103 解析部
104 パターン生成部
105 パターン選択部
106 抽出メタルール生成部
107 抽出部
108 差分検出部
109 差分提示部
110 入力部
111 記憶部
112 表示部
113 音声出力部
201 CPU
202 ROM
203 RAM
204 補助記憶装置
205 表示装置
206 ネットワークI/F
207 操作装置
208 DVDドライブ
209 DVD
210 スピーカ
211 バス
401 入力文書
501、502 抽出表記
601a、601b、602 ポインタ
611a、611b、612 ポインタ
701、711a〜711c 音声再生用アイコン
Claims (11)
- 文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得部と、
前記編集領域の文書構造を解析する解析部と、
前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成部と、
前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件を生成する第2生成部と、
前記文書から、前記抽出条件に適合するテキストを抽出する抽出部と、
を備えた読み上げ情報編集装置。 - 前記文書の読み上げ情報を編集する第1編集部を、さらに備えた請求項1に記載の読み上げ情報編集装置。
- 前記第1生成部は、前記編集領域を段階的に抽象化して複数の前記条件パターンを生成し、
前記第2生成部は、2以上の前記条件パターンを含む前記抽出条件を生成し、
前記抽出部により抽出されたテキストそれぞれが適合する前記条件パターンの差分を検出する検出部と、前記抽出部により抽出されたテキストを、前記差分が明示されるように表示装置に出力させる出力制御部と、をさらに備えた請求項1に記載の読み上げ情報編集装置。 - 前記出力制御部は、前記差分に基づいて、前記抽出部により異なる前記条件パターンで抽出されたテキストをそれぞれ視覚的に異なるように前記表示装置に出力させる請求項3に記載の読み上げ情報編集装置。
- 前記取得部は、さらに前記編集領域に付加された前記読み上げ情報を取得し、
前記出力制御部は、前記抽出部により抽出されたテキストのうち少なくともいずれかのテキストに対して、前記編集領域の前記読み上げ情報を適用した場合の読み上げ音声を音声出力装置に出力させる請求項3に記載の読み上げ情報編集装置。 - 前記条件パターンは、前記編集領域のテキストの文書構造を示す抽象化したパターンである請求項1に記載の読み上げ情報編集装置。
- 前記第1生成部は、前記編集領域を段階的に抽象化して複数の前記条件パターンを生成し、
前記第1生成部により生成された複数の前記条件パターンから1以上の前記条件パターンを選択する選択部を、さらに備え、
前記第2生成部は、前記選択部により選択された前記条件パターンを含む前記抽出条件を生成する請求項1に記載の読み上げ情報編集装置。 - 前記第1生成部は、前記編集領域に含まれる連番の記号または数字をカウンタ要素として同一種別とする抽象化、前記編集領域の同じ品詞のテキストを同一種別とする抽象化、および、前記編集領域において1種以上の品詞の繰り返しを受容することによる抽象化のうち少なくともいずれかの抽象化に基づいて前記条件パターンを生成する請求項1に記載の読み上げ情報編集装置。
- 前記編集領域を抽象化するための規則であるパターンルールを編集する第2編集部を、さらに備え、
前記第1生成部は、前記編集領域を前記パターンルールに従って抽象化して、前記条件パターンを生成する請求項1に記載の読み上げ情報編集装置。 - 文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得ステップと、
前記編集領域の文書構造を解析する解析ステップと、
前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成ステップと、
前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件となる抽出条件を生成する第2生成ステップと、
前記文書から、前記抽出条件に適合するテキストを抽出する抽出ステップと、
を有する読み上げ情報編集方法。 - コンピュータを、
文書から読み上げ情報が付加されたテキストを含む編集領域を取得する取得部と、
前記編集領域の文書構造を解析する解析部と、
前記文書構造に基づいて、前記編集領域を抽象化した1以上の条件パターンを生成する第1生成部と、
前記条件パターンのうち少なくとも1つを含み、前記文書からテキストを抽出するための抽出条件となる抽出条件を生成する第2生成部と、
前記文書から、前記抽出条件に適合するテキストを抽出する抽出部と、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016050089A JP6523998B2 (ja) | 2016-03-14 | 2016-03-14 | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム |
US15/428,701 US10255904B2 (en) | 2016-03-14 | 2017-02-09 | Reading-aloud information editing device, reading-aloud information editing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016050089A JP6523998B2 (ja) | 2016-03-14 | 2016-03-14 | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017167219A JP2017167219A (ja) | 2017-09-21 |
JP6523998B2 true JP6523998B2 (ja) | 2019-06-05 |
Family
ID=59787038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016050089A Expired - Fee Related JP6523998B2 (ja) | 2016-03-14 | 2016-03-14 | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10255904B2 (ja) |
JP (1) | JP6523998B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021152696A (ja) * | 2020-03-24 | 2021-09-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN118280342B (zh) * | 2024-05-31 | 2024-08-09 | 贵阳朗玛信息技术股份有限公司 | 一种朗读流式Markdown文本并跟踪显示朗读进度的方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3076047B2 (ja) | 1989-07-26 | 2000-08-14 | 日本電気株式会社 | ポーズ挿入位置決定装置 |
JPH1152973A (ja) | 1997-08-07 | 1999-02-26 | Ricoh Co Ltd | 文書読み上げ方式 |
JP2001100781A (ja) * | 1999-09-30 | 2001-04-13 | Sony Corp | 音声処理装置および音声処理方法、並びに記録媒体 |
US6865533B2 (en) | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
US20040054535A1 (en) * | 2001-10-22 | 2004-03-18 | Mackie Andrew William | System and method of processing structured text for text-to-speech synthesis |
JP4551066B2 (ja) | 2003-07-14 | 2010-09-22 | ブラザー工業株式会社 | 音声合成装置、音声合成方法及び音声合成プログラム |
JP4478939B2 (ja) * | 2004-09-30 | 2010-06-09 | 株式会社国際電気通信基礎技術研究所 | 音声処理装置およびそのためのコンピュータプログラム |
KR100669241B1 (ko) * | 2004-12-15 | 2007-01-15 | 한국전자통신연구원 | 화행 정보를 이용한 대화체 음성합성 시스템 및 방법 |
US8447610B2 (en) * | 2010-02-12 | 2013-05-21 | Nuance Communications, Inc. | Method and apparatus for generating synthetic speech with contrastive stress |
JP2012198277A (ja) | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
JP6127371B2 (ja) * | 2012-03-28 | 2017-05-17 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
GB2505400B (en) * | 2012-07-18 | 2015-01-07 | Toshiba Res Europ Ltd | A speech processing system |
JP2014240884A (ja) * | 2013-06-11 | 2014-12-25 | 株式会社東芝 | コンテンツ作成支援装置、方法およびプログラム |
JP6411015B2 (ja) * | 2013-09-12 | 2018-10-24 | 富士通株式会社 | 音声合成装置、音声合成方法、およびプログラム |
JP6290230B2 (ja) * | 2013-10-10 | 2018-03-07 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
US9589183B2 (en) * | 2013-11-22 | 2017-03-07 | Parchment, Inc. | System and method for identification and extraction of data |
JPWO2015162737A1 (ja) | 2014-04-23 | 2017-04-13 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
JP6392445B2 (ja) * | 2015-03-24 | 2018-09-19 | 株式会社東芝 | 音訳支援装置、音訳支援方法及び音訳支援プログラム |
US10042846B2 (en) * | 2016-04-28 | 2018-08-07 | International Business Machines Corporation | Cross-lingual information extraction program |
WO2018131048A1 (en) * | 2017-01-11 | 2018-07-19 | Satyanarayana Krishnamurthy | System and method for natural language generation |
-
2016
- 2016-03-14 JP JP2016050089A patent/JP6523998B2/ja not_active Expired - Fee Related
-
2017
- 2017-02-09 US US15/428,701 patent/US10255904B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20170263238A1 (en) | 2017-09-14 |
JP2017167219A (ja) | 2017-09-21 |
US10255904B2 (en) | 2019-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11176141B2 (en) | Preserving emotion of user input | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
US8355919B2 (en) | Systems and methods for text normalization for text to speech synthesis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
US9304987B2 (en) | Content creation support apparatus, method and program | |
US7801722B2 (en) | Techniques for customization of phonetic schemes | |
JP2008083952A (ja) | 辞書作成支援システム、方法及びプログラム | |
JP2016099741A (ja) | 情報抽出支援装置、方法およびプログラム | |
US10089975B2 (en) | Transliteration work support device, transliteration work support method, and computer program product | |
Cassidy et al. | Tools for multimodal annotation | |
TW200842662A (en) | Stroke number input | |
JP6523998B2 (ja) | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム | |
US20130080163A1 (en) | Information processing apparatus, information processing method and computer program product | |
JP2005031259A (ja) | 自然言語処理方法 | |
US10373606B2 (en) | Transliteration support device, transliteration support method, and computer program product | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP4341077B2 (ja) | 文書処理装置、文書処理方法、および、文書処理プログラム | |
JP2005011382A (ja) | 特許明細書の作成方法 | |
JP2015055793A (ja) | 音声合成装置、音声合成方法、およびプログラム | |
JP7280055B2 (ja) | 歌唱発音文字列自動補正プログラム及び歌唱発音文字列自動補正装置 | |
US20240005906A1 (en) | Information processing device, information processing method, and information processing computer program product | |
JP5262190B2 (ja) | 入力補完装置、及び入力補完プログラム | |
JP2007127994A (ja) | 音声合成方法及び音声合成装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190426 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6523998 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |