JP6172491B2 - テキスト整形プログラム、方法及び装置 - Google Patents
テキスト整形プログラム、方法及び装置 Download PDFInfo
- Publication number
- JP6172491B2 JP6172491B2 JP2012186302A JP2012186302A JP6172491B2 JP 6172491 B2 JP6172491 B2 JP 6172491B2 JP 2012186302 A JP2012186302 A JP 2012186302A JP 2012186302 A JP2012186302 A JP 2012186302A JP 6172491 B2 JP6172491 B2 JP 6172491B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- attribute
- text
- synonym
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
文字を読む場合には読めても、聞き馴染みのない単語は、可能な限り使用しない方が好ましい。
「木」や「気」といった短い単語、母音の「イ」や「エ」を多く含む単語等、母音の無声化が多い単語等については、音韻的に聞き取りにくいので、可能な限り使用しない方が好ましい。
同音異義語が多い単語等、複数の意味を有する単語等、曖昧性が多い単語等、漢語や音読みの単語等は、意味が取りにくいので、可能な限り使用しない方が好ましい。
公に出力されることが禁止されている単語等は、可能な限り使用しないようにする。出力忌避度合いとも呼ぶものとする。
文全体の属性と、当該文に含まれる単語の属性とが異なっていると、聞き手は違和感を感ずるので、できる限り文全体の属性と、当該文に含まれる単語の属性とは一致することが好ましい。一致しない場合には、違和感を感じて意味を理解しづらくなる。上で述べた例では、楽しさの度合い、お悔やみの度合い、子供向けの度合い、高齢者向けの度合い、非常通報の度合い、格調の高さの度合いによって属性の一致度合いを評価する。
使用する音声合成部23毎に、得手不得手があり、不得意な単語については、可能な限り出力回避すべきである。このような音声合成部23における単語の忌避度合いも、聞き取りやすさという点においては重要となる。なお、忌避するか否かの2段階だけではなく、さらに多い段階にて忌避度合いを表すようにしても良い。
D={(a1−b1)2+(a2−b2)2+(a3−b3)2+(a4−b4)2+(a5−b5)2+(a6−b6)2}1/2
11 入力テキスト格納部
12 単語分割部
13 発音決定部
14 ラティス生成部
15 ラティス格納部
16 スコア計算部
17 単語辞書格納部
18 候補抽出部
19 提示部
20 韻律コマンド挿入部
21 入力部
22 出力データ格納部
23 音声合成部
24 スピーカ
Claims (6)
- データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を、コンピュータに実行させるためのテキスト整形プログラム。 - 前記特定ステップが、
前記入力テキストに含まれる文について、第2のデータ格納部に格納されており且つ当該文に含まれる単語について設定されている1又は複数の属性の属性値を読み出して、当該文の属性値を算出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語及び当該単語について抽出された前記同義異音語との各々について、前記第2のデータ格納部に格納されている1又は複数の属性の属性値を読み出して、前記文の属性値との一致度合いに応じたスコアを算出するステップと、
を含む請求項1記載のテキスト整形プログラム。 - 前記判定要素が、
(1)聞き馴染み度合いと、(2)使用するテキスト音声合成における忌避度合いと、(3)音韻的な聞き取りにくさの度合いと、(4)意味の取りにくさの度合いと、(5)予め定められた出力禁止単語であるか否かとのうち少なくともいずれかをさらに含む
請求項1又は2記載のテキスト整形プログラム。 - 前記特定ステップで特定された置換候補を採用しないと指示された場合、採用されなかった前記置換候補の元の単語について、ポーズを挿入するコマンドを前記入力テキストに挿入するステップ
をさらに前記コンピュータに実行させる請求項1乃至3のいずれか1つ記載のテキスト整形プログラム。 - データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出するステップと、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する特定ステップと、
を含み、コンピュータに実行させるテキスト整形方法。 - データ格納部に格納された入力テキストに含まれる各単語について、同義異音語を抽出する手段と、
前記入力テキストに含まれ且つ同義異音語が抽出された各単語について、前記入力テキストに含まれる文に含まれ且つ当該単語を含む複数の単語の属性から特定される前記文の属性と、当該単語の属性及び当該単語について抽出された前記同義異音語の属性との一致度合いを少なくとも含む判定要素に基づき、当該単語について抽出された前記同義異音語のうち置換候補を特定する手段と、
を有する情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186302A JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012186302A JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014044289A JP2014044289A (ja) | 2014-03-13 |
JP6172491B2 true JP6172491B2 (ja) | 2017-08-02 |
Family
ID=50395600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012186302A Active JP6172491B2 (ja) | 2012-08-27 | 2012-08-27 | テキスト整形プログラム、方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6172491B2 (ja) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334089A (ja) * | 1997-06-05 | 1998-12-18 | Fujitsu Ltd | 文字入力装置 |
JP4636673B2 (ja) * | 2000-11-16 | 2011-02-23 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
JP4811557B2 (ja) * | 2005-02-18 | 2011-11-09 | 独立行政法人情報通信研究機構 | 音声再生装置及び発話支援装置 |
JP2008083239A (ja) * | 2006-09-26 | 2008-04-10 | Toshiba Corp | 中間言語編集装置、中間言語編集方法および中間言語編集プログラム |
WO2008056590A1 (fr) * | 2006-11-08 | 2008-05-15 | Nec Corporation | Dispositif de synthèse texte-parole, programme et procédé de synthèse texte-parole |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2011247928A (ja) * | 2010-05-24 | 2011-12-08 | Nec Corp | 読み決定装置、読み決定方法、読み決定プログラム、音声合成装置、音声合成方法、及び、音声合成プログラム |
JP5106608B2 (ja) * | 2010-09-29 | 2012-12-26 | 株式会社東芝 | 読み上げ支援装置、方法、およびプログラム |
-
2012
- 2012-08-27 JP JP2012186302A patent/JP6172491B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014044289A (ja) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
US10037758B2 (en) | Device and method for understanding user intent | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
JP6471074B2 (ja) | 機械翻訳装置、方法及びプログラム | |
KR20150146373A (ko) | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 | |
CN106710585B (zh) | 语音交互过程中的多音字播报方法及系统 | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
KR20170035529A (ko) | 전자 기기 및 그의 음성 인식 방법 | |
JP2013109061A (ja) | 音声データ検索システムおよびそのためのプログラム | |
KR20170057623A (ko) | 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP5079718B2 (ja) | 外国語学習支援システム、及びプログラム | |
JP4964695B2 (ja) | 音声合成装置及び音声合成方法並びにプログラム | |
CN113851106B (zh) | 音频播放方法、装置、电子设备和可读存储介质 | |
JP6172491B2 (ja) | テキスト整形プログラム、方法及び装置 | |
JP2013061591A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP5975033B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2017198790A (ja) | 音声評定装置、音声評定方法、教師変化情報の生産方法、およびプログラム | |
JP2017015823A (ja) | 発話練習装置、表示制御方法、及びプログラム | |
JP2021089300A (ja) | 多言語音声認識およびテーマ−意義素解析方法および装置 | |
JP2016142936A (ja) | 音声合成用データ作成方法、及び音声合成用データ作成装置 | |
JP4173404B2 (ja) | 文セット自動生成装置、文セット自動生成プログラム、記憶媒体 | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
WO2023047623A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
KR101030777B1 (ko) | 스크립트 데이터 생성 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6172491 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |