JP5596649B2 - 文書マークアップ支援装置、方法、及びプログラム - Google Patents
文書マークアップ支援装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5596649B2 JP5596649B2 JP2011209849A JP2011209849A JP5596649B2 JP 5596649 B2 JP5596649 B2 JP 5596649B2 JP 2011209849 A JP2011209849 A JP 2011209849A JP 2011209849 A JP2011209849 A JP 2011209849A JP 5596649 B2 JP5596649 B2 JP 5596649B2
- Authority
- JP
- Japan
- Prior art keywords
- tag
- markup
- candidate
- tags
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 2
- 230000008451 emotion Effects 0.000 description 23
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Description
さらに、SSMLは、マークアップした箇所を会話調や警告調など発話スタイルを変えて読み上げる機能、喜怒哀楽といった感情を込めて読み上げる機能、話者(声質)を変えて読み上げる機能を有する。これによって、臨場感を高めて読み上げることができるので、音声合成の自動朗読への応用が試みられる。
マークアップを支援する手法として、たとえば、人手でテキストの一部に対してマークアップした学習用コーパスから機械学習手法でモデルを学習し、未知のテキストに対して自動でマークアップする技術が一般的に知られている。具体的には、テキストから感情を推定して感情タグを自動で付与する感情推定技術がある。また、音声読み上げのマークアップに限らず、単語の品詞をマークアップする品詞マークアップや、見出し、本文および広告などテキストの構造をマークアップする構造マークアップなどが知られている。この構造マークアップに対して、テキストの内容やレイアウトの類似性を元にマークアップを支援する技術もある。しかし、上述の従来技術では、人手でテキストをマークアップするには労力がかかり、逆に自動でマークアップするとユーザの主観や好みに応じてマークアップすることができない。
本実施形態に係る文書マークアップ支援装置を用いる文書マークアップ支援システムの利用例について図1を参照して説明する。
図1では、文書マークアップ支援システムとして電子書籍朗読サービスシステムを提供する例を示す。
文書マークアップ支援システム100は、管理サーバ101、ユーザ端末A102−1、ユーザ端末B102−2およびユーザ端末C102−3を含む。
管理サーバ101は、電子書籍151の文章にタグを付与して、マークアップ文書152(以下、マークアップテキスト152)を作成する。タグは、図1の例では、<angry>タグ(怒り)や<fear>タグ(怖れ)を用いており、タグで囲まれた語または文章が、怒りの感情や怖れの感情を込めた音声で読み上げられることを意味する。ここで、タグが付与されたテキストをマークアップテキストと呼ぶ。
ユーザ端末A102−1からユーザ端末C102−3は、マークアップテキスト152をダウンロードするため、要求信号を管理サーバ101へ送信する。管理サーバ101は、要求信号を受け取り、要求信号を送信してきたユーザ端末102に対してマークアップテキストを配信する。
修正マークアップテキスト153は、ユーザ端末102から管理サーバ101に送信され、他のユーザと共有される。ここで、共有とは、他のユーザがマークアップしたマークアップテキストの閲覧およびダウンロードができることを意味し、さらにマークアップテキストがタグの付与や後述するマークアップの修正候補提示の際の基礎データとして用いられることも意味する。
本実施形態に係る文書マークアップ支援装置200は、共有マークアップテキスト格納部201、マークアップテキスト共有部202、タグ格納部203、タグ付与部204、特徴量取得部205、マークアップテキスト変換部206、修正候補検出部207、タグ分散計算部208、タグ候補計算部209および修正情報表示部210を含む。
図3に示すように、テキストが文章単位に分割され、文章ID301、デフォルトタグ302、ユーザタグ303、及び文章304がそれぞれ対応付けられて、共有マークアップテキストとしてテーブルに格納される。ここでは、機械学習による自動推定結果で付与されたデフォルトタグ302と、ユーザAからユーザCが各文章ID301に対してユーザ好みのタグを付与したユーザタグ303とが文章304に関連づけられる。デフォルトタグ302も1人のユーザとして扱ってもよい。具体的には、文章ID301「7」、文章304「何言ってるんだよ。」という文章に対して、デフォルトタグ302として「怒」が付与され、ユーザタグ303としてユーザAは「喜」、ユーザBは「恥」、ユーザCは「怒」を付与する。読み上げ時には、付与したタグの感情を込めて各文章の読み上げを行なう。
なお、電子書籍のテキストとタグとは、別々に管理してもよい。また、文章をマークアップの基本単位としているが、文字、単語、パラグラフなど別の単位を基準にマークアップを行ってもよい。
ここでは、共有マークアップテキスト格納部201、マークアップテキスト共有部202、タグ格納部203およびタグ付与部204が図1に示す管理サーバ101に含まれるとする。また、特徴量取得部205、マークアップテキスト変換部206、修正候補検出部207、タグ分散計算部208、タグ候補計算部209および修正情報表示部210が図1に示すユーザ端末102に含まれるとする。なお、文書マークアップ支援装置200に含まれる各部は、管理サーバ101及びユーザ端末102にどのように含まれていてもよい。
ステップS401では、タグ付与部204が、テキストに対してデフォルトタグを付与する。デフォルトタグの付与方法としては、たとえば、既存の機械学習を用いた自動推定による方法、共有マークアップテキストから最大数のタグを付与する方法、共有マークアップテキストから他のユーザに最も支持されたタグを付与する方法を用いればよい。
ステップS403では、ユーザ端末102において、修正候補検出部207が、マークアップテキストからタグを修正すべき文章である修正候補を検出し、タグ候補計算部209が、タグを修正する際のタグ候補を計算する。その後、修正情報表示部210が、修正候補とタグ候補とをユーザに表示する。
ステップS404では、修正候補とタグ候補とを参照して、ユーザが修正候補にタグを追加したり、修正候補におけるタグを修正したりと言った、タグの編集を行なう。
ステップS405では、ユーザ端末102が、タグが追加または修正されたマークアップテキストを管理サーバ101に送る。管理サーバ101は、ユーザ端末102から送られた修正されたマークアップテキストを収集し、共有マークアップテキスト格納部201に格納する。多数のユーザによりマークアップテキストのタグが編集(追加及び修正)されることによって、共有マークアップテキストを用いたデフォルトタグの付与精度を向上させることができる。デフォルトタグの付与精度が向上すれば、ユーザがタグを修正する箇所が減少すると考えられ、より効率のよいマークアップを行なうことができる。
ステップS501では、特徴量取得部205が、共有マークアップテキスト中の各タグについて、特徴量を取得する。
ステップS502では、マークアップテキスト変換部206が、共有マークアップテキストのタグをステップS501で定義した特徴量に変換し、特徴量の時系列データを得る。
ステップS503では、タグ分散計算部208が、タグを付与する基本単位ごとに分散を計算する。なお、ユーザが付与したタグのばらつき度合いが定義できれば分散でなくても構わない。ここでは、分散に準じた値も含めてばらつきを意味する語として分散を用いる。
ステップS504では、修正候補検出部207が、分散が閾値以上であるタグを、修正する可能性が高い修正候補として検出し、修正情報表示部210が修正候補を表示する。
ステップS505では、タグ候補計算部209が、修正候補においてどのようなタグ候補を提示するかを決定し、修正情報表示部210がユーザに対してタグ候補を提示する。
図6(a)はタグ間の距離の概念図を表し、図6(b)はタグと対応する座標値とを示すテーブルである。
以上のことから、読み上げ効果が大きく異なるタグで、ばらつきがある箇所は、修正の可能性が高いためユーザに修正候補として提示する。付与されるタグにばらつきがまったくない、もしくは読み上げ効果が近いタグでばらついている箇所は、修正の可能性が低いのでユーザには修正候補として提示しない。このように修正箇所を絞り込むことで、ユーザのマークアップ修正効率を大幅に高めることができる。
図6では、感情タグの例のみを示すが、ピッチ、話す速度、ボリューム、発話スタイル、話者など任意のタグでもよい。たとえば、話者の場合は、男声と女声とでは距離が遠く(類似度が低く)、声のスペクトルを比較して距離を求めるなどの手法でタグ間の距離を定義してもよい。また、本実施例ではタグ間の距離の定義はあらかじめ固定されているが、2次元座標平面601上へのタグの配置や距離の定義をユーザが自由に変更できるインタフェースを用意してもよい。たとえば、ユーザがインタフェースを介して指示信号を特徴量取得部205に入力し、特徴量取得部205は、指示信号に応じてタグの配置および距離の定義を変更すればよい。さらに、特徴量を2次元ベクトルで表現したが、タグ間の距離が定義できればどのような特徴量でもよい。
図7に示す共有マークアップテキストのテーブルは、図3に示す共有マークアップテキストのタグが特徴量701に変換され、さらに特徴量の分散702がそれぞれ対応付けられて追加される。具体的には、例えば、文章ID301「7」、デフォルトタグ302の特徴量701「(−0.5,0.5)」、ユーザタグとして、ユーザAが付与したタグの特徴量「(0.9,0.2)」、ユーザBが付与したタグの特徴量「(−1.0,−0.1)」、ユーザCが付与したタグの特徴量「(−0.5,0.5)」、分散702「0.75」および文章304「何言ってるんだよ。」がそれぞれ対応付けられる。このようにマークアップテキストが特徴量の時系列データとして表せる。
タグの分散の計算は、本実施形態では、図7の特徴量の次元ごとに分散を計算してから足し合わせている。たとえば、文章ID 7の文章の分散は、式(1)のように計算できる。
variance=sum(diag(cov(A)))
で計算できる。ここで、sum()は和を求める関数、diag()は対角線の要素を取得する関数、およびcov()は分散共分散行列を計算する関数である。同様の方法ですべての文章に対応付けられた特徴量について分散を計算する。
図8は、図7の文章ID301および分散702の項目について、横軸に文章ID301および縦軸に分散702を取った文章IDごとの分散を表すグラフである。このグラフから、タグのばらつきが大きい箇所と小さい箇所とを認識することができる。なお、分散の値は、タグ間の距離も考慮して計算されているので、読み上げ効果が似ているタグ同士では分散が小さくなる。修正候補検出部207は、分散が閾値以上となる文章を修正候補として選択する。
具体的には、文章ID 7のように怒、喜および恥のように読み上げ効果が大きく異なるタグが付与される場合は、すなわちタグ間の距離が遠い(類似度が低い)場合は、分散は大きな値となる。一方、文章ID 1のように全員が同じタグ「安」を付与したり、文章ID 22および文章ID 23の「好」「安」および「喜」のように、付与されるタグは異なっていても読み上げ効果が似ている、すなわちタグ間の距離が近い(類似度が高い)場合は、分散は小さな値となる。よって、分散が大きければ文章ID 7ごとの分散を、ユーザによる主観や好みによって付与されるタグが異なっているためユーザに修正を促した方がよい箇所として修正候補を選択する。
図9は、修正候補を表示するユーザインタフェースの一例であり、ユーザがテキスト901を読みながら、テキスト901に関する読み上げ音声を聞いている場合を想定する。
読み上げ中に修正候補が存在する場合、修正候補を強調してポップアップ903を表示し、ユーザに他の読み上げ候補が可能であることを提示する。具体的には、タグ分散計算部208における計算で分散が閾値以上である修正候補902(文章ID 7「何言ってるんだよ。」)を強調して表示し、ポップアップ903として「異なる読み上げ方が可能です。候補を提示しますか?」とユーザに他の候補の選択を促す。別の方法として、修正候補を読み上げ前に一覧で表示し、ユーザが事前にタグを一括修正してもよい。なお、図9では、修正候補をポップアップで表示させる例を示すが、別ウィンドウに修正候補を表示してもよく、ユーザが修正候補を認識できればどのような方法でもよい。
ステップS1001では、タグ候補計算部209が、共有マークアップテキスト格納部201に格納される共有マークアップテキストから、全ユーザがこれまでに修正した修正候補と修正したタグの情報とを収集する。
ステップS1002では、タグ候補計算部209が、新規ユーザと同様の傾向でタグを修正したユーザを、新規ユーザとの類似度に基づいて検索する。ここでは、新規ユーザとの類似度算出の一例として、タグ間の距離と同様に、ユーザ間の距離を算出する。まず、文章ごとにタグ間のユークリッド距離を計算し、全文章について計算されたユークリッド距離を加算し、値が閾値以下となるユーザを新規ユーザと類似度が高いユーザとして選択すればよい。具体例については、図12を参照して後述する。
ステップS1003では、新規ユーザと類似度が高いユーザが付与したタグに基づいてタグ候補を新規ユーザに提示する。
図11に示すテーブルは、図7に示したテーブルに新規ユーザ1101のタグの欄が追加されたテーブルであり、共有マークアップテキスト格納部201に格納されている。新規ユーザが修正した修正候補1102である文章ID 7、8、10、11および13に対してすでにタグが付与され、次の修正候補1103に対して、文章ID 15にタグを付与する場合を示す。
タグ候補計算部209は、新規ユーザのこれまでに修正した修正候補及び修正したタグの情報として、新規ユーザが文章に付与したタグの特徴量、文章ID 7(0.9,0.2)、文章ID 8(0.2,0.9)、文章ID 10(−0.9,0.1)、文章ID 11(−0.9,0.1)および文章ID 13(−0.9,0.8)の5つを収集する。
図12は、新規ユーザがタグを修正した文章IDにおけるタグの特徴量と、同一の文章IDにおけるデフォルトタグ及びユーザAからユーザCが付与したタグの特徴量とを抽出したテーブルである。上述の5個の修正候補の文章IDを基に、新規ユーザとの距離を計算する。具体的には、たとえば新規ユーザとユーザBとのユークリッド距離1201は、以下の式(2)で表される。
よって、新規ユーザ1101とマークアップの類似度が高いのは、新規ユーザ1101と距離が近い順であるユーザA、ユーザC、ユーザBおよびデフォルトタグの順番となる。すなわち、ユーザAが新規ユーザ1101と最もマークアップの傾向が近く、主観や好みが似ていると判定することができる。
なお、上述の例では、新規ユーザがタグを修正した文章に絞って距離を計算したが、マークアップテキスト全ての文章に基づいてユーザ間の距離を計算してもよい。この方法で計算したユーザ間の距離は、タグ間の距離を反映した距離となる。
タグ候補の提示方法としては、たとえば、新規ユーザと距離が最も近いユーザのマークアップを参照して、新規ユーザと距離が最も近いユーザの、該当文章におけるタグをそのまま提示する。具体的には、図12ではユーザAが新規ユーザと最も距離が近いので、ユーザAが文章ID 15に付けたタグである哀(特徴量:−0.9,−0.2)を、新規ユーザの文章ID 15に付与するタグ候補として提示する。また、図13のように、付与されたタグの割合をポップアップ1301で表示してもよい。さらに、新規ユーザと距離が近いユーザを順に一定数選択し、その中で最も多く文書に付与されたタグのうち、最大数のタグを提示してもよいし、ランキングとして順に表示してもよい。
図14は、本実施形態の管理サーバ101およびユーザ端末102のハードウェア構成を示すブロック図である。管理サーバ101およびユーザ端末102は、CPU(Central Processing Unit)1401、ROM(Read Only Memory)1402、RAM(Random Access Memory)1403、HDD(Hard Disk Drive)1404、表示部1405、送受信部1406および操作部1407を含み、それぞれがバス1408により相互に接続されている。
ROM1402は、CPUによる各種処理を実現するプログラムなどを記憶する。たとえば、図2に示した各モジュールはプログラムとしてROMに格納される。
RAM1403は、CPUによる各種処理に必要なデータを記憶する。
HDD1404は、電子書籍などのテキスト、共有マークアップテキスト、タグなど大規模なデータを記憶する。
表示部1405は、テキスト、タグ候補などを表示する。
送受信部1406は、電子書籍やマークアップテキストに関する送受信を行う。
操作部1407は、提示された情報に対してユーザが指示を入力する。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (8)
- 文章の読み上げを制御するタグごとに、他のタグとのタグ間の類似度である第1類似度を定義するために用いる特徴量を取得する取得部と、
文字列に付与された複数のタグの少なくとも1つが異なる、共有のマークアップ文書について、前記文字列に付与された該タグの特徴量の分散を前記文字列ごとに計算する第1計算部と、
前記分散が第1閾値以上となる文字列を、タグを修正すべき第1候補として検出する検出部と、
前記第1候補を提示する提示部と、を具備することを特徴とする文書マークアップ支援装置。 - 前記文字列に各ユーザが付与したタグの特徴量からユーザ間の類似度である第2類似度を計算し、前記第2類似度が第2閾値以上であるユーザが付与したタグに基づいて、前記第1候補に付与されるべきタグの候補を示す第2候補を選択する第2計算部をさらに具備し、
前記提示部は、前記第2候補をさらに提示することを特徴とする請求項1に記載の文書マークアップ支援装置。 - 前記第2計算部は、複数の第2候補を融合して新しいタグを生成することを特徴とする請求項2に記載の文書マークアップ支援装置。
- 1以上のユーザにより編集されたマークアップ文書に基づいて、前記文字列にタグを付与するタグ付与部をさらに具備することを特徴とする請求項1から請求項3のいずれか1項に記載の文書マークアップ支援装置。
- 前記取得部は、指示信号に応じて前記第1類似度を変更することを特徴とする請求項1から請求項4のいずれか1項に記載の文書マークアップ支援装置。
- 前記提示部は、前記第1候補に対する第2候補を関連づけて提示することを特徴とする請求項2から請求項5のいずれか1項に記載の文書マークアップ支援装置。
- 文章の読み上げを制御するタグごとに、他のタグとのタグ間の類似度である第1類似度を定義するために用いる特徴量を取得し、
文字列に付与された複数のタグの少なくとも1つが異なる、共有のマークアップ文書について、前記文字列に付与された該タグの特徴量の分散を前記文字列ごとに計算し、
前記分散が第1閾値以上となる文字列を、タグを修正すべき第1候補として検出し、
前記第1候補を提示することを具備することを特徴とする文書マークアップ支援方法。 - コンピュータを、
文章の読み上げを制御するタグごとに、他のタグとのタグ間の類似度である第1類似度を定義するために用いる特徴量を取得する取得手段と、
文字列に付与された複数のタグの少なくとも1つが異なる、共有のマークアップ文書について、前記文字列に付与された該タグの特徴量の分散を前記文字列ごとに計算する計算手段と、
前記分散が第1閾値以上となる文字列を、タグを修正すべき第1候補として検出する検出手段と、
前記第1候補を提示する提示手段として機能させるための文書マークアップ支援プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011209849A JP5596649B2 (ja) | 2011-09-26 | 2011-09-26 | 文書マークアップ支援装置、方法、及びプログラム |
US13/625,138 US8965769B2 (en) | 2011-09-26 | 2012-09-24 | Markup assistance apparatus, method and program |
CN2012103640392A CN103020019A (zh) | 2011-09-26 | 2012-09-26 | 标记辅助设备、方法和程序 |
US14/597,365 US9626338B2 (en) | 2011-09-26 | 2015-01-15 | Markup assistance apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011209849A JP5596649B2 (ja) | 2011-09-26 | 2011-09-26 | 文書マークアップ支援装置、方法、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014160760A Division JP5784196B2 (ja) | 2014-08-06 | 2014-08-06 | 文書マークアップ支援装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013073275A JP2013073275A (ja) | 2013-04-22 |
JP5596649B2 true JP5596649B2 (ja) | 2014-09-24 |
Family
ID=47912251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011209849A Expired - Fee Related JP5596649B2 (ja) | 2011-09-26 | 2011-09-26 | 文書マークアップ支援装置、方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US8965769B2 (ja) |
JP (1) | JP5596649B2 (ja) |
CN (1) | CN103020019A (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130091150A1 (en) * | 2010-06-30 | 2013-04-11 | Jian-Ming Jin | Determiining similarity between elements of an electronic document |
US20140297285A1 (en) * | 2013-03-28 | 2014-10-02 | Tencent Technology (Shenzhen) Company Limited | Automatic page content reading-aloud method and device thereof |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922055A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
KR20160017954A (ko) * | 2014-08-07 | 2016-02-17 | 삼성전자주식회사 | 전자장치 및 전자장치의 전송 제어 방법 |
JP6415929B2 (ja) * | 2014-10-30 | 2018-10-31 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
CN105096932A (zh) * | 2015-07-14 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 有声读物的语音合成方法和装置 |
CN105741829A (zh) * | 2016-04-28 | 2016-07-06 | 玉环看知信息科技有限公司 | 数据转换方法及装置 |
US10311876B2 (en) * | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
US10449440B2 (en) | 2017-06-30 | 2019-10-22 | Electronic Arts Inc. | Interactive voice-controlled companion application for a video game |
US10621317B1 (en) | 2017-09-14 | 2020-04-14 | Electronic Arts Inc. | Audio-based device authentication system |
US10565994B2 (en) * | 2017-11-30 | 2020-02-18 | General Electric Company | Intelligent human-machine conversation framework with speech-to-text and text-to-speech |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
KR101983517B1 (ko) * | 2018-11-30 | 2019-05-29 | 한국과학기술원 | 주어진 문서가 독자에게 보다 높은 신뢰를 받을 수 있도록 하는 문서 신뢰도 증강 방법 및 그 시스템 |
CN110597980B (zh) * | 2019-09-12 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及计算机可读存储介质 |
US11393471B1 (en) * | 2020-03-30 | 2022-07-19 | Amazon Technologies, Inc. | Multi-device output management based on speech characteristics |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05113795A (ja) * | 1991-05-31 | 1993-05-07 | Oki Electric Ind Co Ltd | 音声合成装置 |
JPH0795303A (ja) * | 1993-09-22 | 1995-04-07 | N T T Data Tsushin Kk | 文書データの音声出力方式 |
US6856958B2 (en) * | 2000-09-05 | 2005-02-15 | Lucent Technologies Inc. | Methods and apparatus for text to speech processing using language independent prosody markup |
JP3664475B2 (ja) | 2001-02-09 | 2005-06-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理方法、情報処理システム、プログラムおよび記録媒体 |
US7062437B2 (en) * | 2001-02-13 | 2006-06-13 | International Business Machines Corporation | Audio renderings for expressing non-audio nuances |
JP2003280680A (ja) * | 2002-03-25 | 2003-10-02 | Canon Inc | 音声合成装置およびその方法およびそのプログラムならびに記憶媒体 |
JP2003295882A (ja) * | 2002-04-02 | 2003-10-15 | Canon Inc | 音声合成用テキスト構造、音声合成方法、音声合成装置及びそのコンピュータ・プログラム |
US20050096909A1 (en) * | 2003-10-29 | 2005-05-05 | Raimo Bakis | Systems and methods for expressive text-to-speech |
JP4575798B2 (ja) * | 2005-02-01 | 2010-11-04 | 日本放送協会 | 音声合成装置及び音声合成プログラム |
EP1959358A4 (en) | 2005-12-05 | 2010-04-07 | Sony Corp | APPARATUS, METHOD AND PROGRAM FOR INFORMATION PROCESSING |
US8095366B2 (en) * | 2006-03-27 | 2012-01-10 | Microsoft Corporation | Fonts with feelings |
JP2008256942A (ja) * | 2007-04-04 | 2008-10-23 | Toshiba Corp | 音声合成データベースのデータ比較装置及び音声合成データベースのデータ比較方法 |
JP5477635B2 (ja) | 2010-02-15 | 2014-04-23 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
-
2011
- 2011-09-26 JP JP2011209849A patent/JP5596649B2/ja not_active Expired - Fee Related
-
2012
- 2012-09-24 US US13/625,138 patent/US8965769B2/en not_active Expired - Fee Related
- 2012-09-26 CN CN2012103640392A patent/CN103020019A/zh active Pending
-
2015
- 2015-01-15 US US14/597,365 patent/US9626338B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20130080175A1 (en) | 2013-03-28 |
US8965769B2 (en) | 2015-02-24 |
CN103020019A (zh) | 2013-04-03 |
JP2013073275A (ja) | 2013-04-22 |
US9626338B2 (en) | 2017-04-18 |
US20150128026A1 (en) | 2015-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5596649B2 (ja) | 文書マークアップ支援装置、方法、及びプログラム | |
US8972265B1 (en) | Multiple voices in audio content | |
CN101996232B (zh) | 信息处理装置和用于处理信息的方法 | |
JP2019527371A (ja) | 声紋識別方法及び装置 | |
US10055493B2 (en) | Generating a playlist | |
US20120239390A1 (en) | Apparatus and method for supporting reading of document, and computer readable medium | |
WO2016197767A2 (zh) | 一种表情输入方法、装置、终端和计算机可读存储介质 | |
US20170062010A1 (en) | Computerized system and method for formatted transcription of multimedia content | |
US9378741B2 (en) | Search results using intonation nuances | |
US10217454B2 (en) | Voice synthesizer, voice synthesis method, and computer program product | |
US20150279347A1 (en) | Text-to-Speech for Digital Literature | |
US10535335B2 (en) | Voice synthesizing device, voice synthesizing method, and computer program product | |
JP2013072957A (ja) | 文書読み上げ支援装置、方法及びプログラム | |
JP7132090B2 (ja) | 対話システム、対話装置、対話方法、及びプログラム | |
JP5477635B2 (ja) | 情報処理装置および方法、並びにプログラム | |
JP6370962B1 (ja) | 生成装置、生成方法および生成プログラム | |
US11604929B2 (en) | Guided text generation for task-oriented dialogue | |
JP2018185561A (ja) | 対話支援システム、対話支援方法、及び対話支援プログラム | |
JP5784196B2 (ja) | 文書マークアップ支援装置、方法、及びプログラム | |
CN111737961A (zh) | 一种故事生成的方法、装置、计算机设备和介质 | |
CN110008807A (zh) | 一种合同内容识别模型的训练方法、装置及设备 | |
US10007843B1 (en) | Personalized segmentation of media content | |
JP5589426B2 (ja) | コンテンツ提供システム、コンテンツ提供方法、およびコンテンツ提供プログラム | |
JP2018045657A (ja) | 学習装置、プログラムパラメータおよび学習方法 | |
JP2010055236A (ja) | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131001 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131205 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131212 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140807 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5596649 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |