JPWO2015162737A1 - 音訳作業支援装置、音訳作業支援方法及びプログラム - Google Patents
音訳作業支援装置、音訳作業支援方法及びプログラム Download PDFInfo
- Publication number
- JPWO2015162737A1 JPWO2015162737A1 JP2016514624A JP2016514624A JPWO2015162737A1 JP WO2015162737 A1 JPWO2015162737 A1 JP WO2015162737A1 JP 2016514624 A JP2016514624 A JP 2016514624A JP 2016514624 A JP2016514624 A JP 2016514624A JP WO2015162737 A1 JPWO2015162737 A1 JP WO2015162737A1
- Authority
- JP
- Japan
- Prior art keywords
- correction
- unit
- document information
- information
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L2013/083—Special characters, e.g. punctuation marks
Abstract
実施形態の音訳作業支援装置は、入力部と、抽出部と、提示部と、受付部と、修正部と、を備える。入力部は、文書情報を入力する。抽出部は、修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンに一致する文書情報の表層表現を修正箇所として抽出する。提示部は、修正箇所の抽出に使用された修正パターンに応じて定められた修正の仕方を提示する。受付部は、修正の仕方の選択を受け付ける。修正部は、選択された修正の仕方に基づいて修正箇所を修正する。
Description
本発明の実施形態は音訳作業支援装置、音訳作業支援方法及びプログラムに関する。
主に視覚障碍や識字障碍の方のために、文章情報から音声情報を生成する音訳作業が行われている。音訳作業では、例えば文章情報から音声合成して得られた音声情報の品質を向上させるため、音声情報の読み誤りやアクセント誤りの修正が行われる。音訳作業により修正された音声情報や音声情報付き複合文書情報は、専用のハードウェアやアプリケーション等の読み上げ装置から出力され、視覚障碍者や識字障碍者等のユーザに利用される。
しかしながら文書情報の音訳作業は、音声試聴と修正という試行錯誤の繰り返し作業となり効率的に作業を行うことが難しかった。
実施形態の音訳作業支援装置は、入力部と、抽出部と、提示部と、受付部と、修正部と、を備える。入力部は文書情報を入力する。抽出部は、修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンに一致する前記文書情報の表層表現を修正箇所として抽出する。提示部は前記修正箇所の抽出に使用された前記修正パターンに応じて定められた修正の仕方を提示する。受付部は前記修正の仕方の選択を受け付ける。修正部は選択された前記修正の仕方に基づいて前記修正箇所を修正する。
以下、添付図面を参照して、音訳作業支援装置、音訳作業支援方法及びプログラムの実施形態を詳細に説明する。
図1は実施形態の音訳作業支援装置100の構成の例を示す図である。音訳作業支援装置100は、作成部1、入力部2、抽出部3、提示部4、受付部5、修正部6及び出力部7を備える。また音訳作業支援装置100は、修正済み文書情報11及び修正パターン情報12を図1では図示されていない記憶部に記憶する。
作成部1は修正済み文書情報11の複数の修正事例から修正パターン情報12を作成する。修正パターン情報12は、複数の修正事例に含まれる表層表現を修正したものをまとめたもの(以下、修正パターンという)に修正の種類(後述の属性)及び属性修正の仕方(後述の属性値)を関連付けた情報である。つまり、修正パターンとは、修正の仕方に規則性がある場合、複数の修正事例に含まれる表層表現を修正したものをまとめたパターンである。
まず修正済み文書情報11について説明する。修正済み文書情報11は、音訳作業で修正した文書情報の修正事例(履歴)を記憶する。音訳作業で修正の対象となる情報は、文書情報、及び、文書情報に含まれる語句及び記号等の音訳の仕方である。文書情報は音訳対象の文書を含む情報である。文書情報の形式は任意でよい。文書情報は、例えば音声と読み上げ文書を同期再生可能な複合文書フォーマットとして出力するための構造情報(タグ等)を有していてもよい。
図2は実施形態の修正済み文書情報11の例を示す図である。修正済み文書情報11は、例えば図2に示されるようなスキーマを有するRDBMS(Relational DataBase Management System)等により記憶される。修正済み文書情報11は、文書ID、行番号、先頭位置、終端位置、表層表現、属性及び属性値のフィールドを含む。文書IDは文書情報を一意に識別する識別情報である。行番号は修正された表層表現の行の番号である。先頭位置は修正された表層表現の先頭の位置を示し、行頭から数えた文字数により表される。終端位置は修正された表層表現の終端の位置を示し、先頭位置と同様に行頭から数えた文字数により表される。表層表現は過去に修正された表層表現である。属性は修正の種類を示す。属性値は修正の仕方を示す。
修正済み文書情報11の各レコードは、過去の修正事例(修正履歴)の各々に対応する。修正済み文書情報11の各レコードについて具体的に説明する。図3は実施形態の文書ID34の文書情報の例を示す図である。図4は実施形態の文書ID58の文書情報の例を示す図である。図5は実施形態の文書ID101の文書情報の例を示す図である。
1番目のレコードは、文書IDが34の文書情報(図3参照)に含まれる文章の1行目の1文字目から12文字目の「作業名:音訳文書編集支援」に、HTML(HyperText Markup Language)のメタ情報として「title」を付与した事例を示す。この事例は表層表現「作業名:音訳文書編集支援」に、タイトルであることを示す情報を付与することにより、例えばタイトルであることに応じた読み上げを読み上げ装置に行わせるための修正である。
2番目のレコードは、文書IDが34の文書情報(図3参照)に含まれる文章の3行目の17文字目から18文字目の「DB」の読み方を示す情報として「データベース」を付与した事例を示す。これにより3行目の17文字目から18文字目の「DB」の読み方は、「デービー」等ではなく「データベース」となる。
3番目のレコードは、文書IDが34の文書情報(図3参照)に含まれる文章の4行目の8文字目から11文字目の表層表現15の読み方を示す情報として属性値16を付与した事例を示す。これにより4行目の8文字目から11文字目の表層表現15の読み方は、漢字を含む語句である属性値16の読み方となる。これにより表層表現15を含む図3の文章は区切りが明確になり、読み上げ時の発音及びアクセント等が適切に行われるようになる。
4番目のレコードは、文書IDが58の文書情報(図4参照)に含まれる文章の1行目の1文字目から15文字目の「<お知らせ>新機能追加について」に、SSML(Speech Synthesis Markup Language)のメタ情報として「pitch=+1」を付与した事例を示す。
5番目のレコードは、文書IDが58の文書情報(図4参照)に含まれる文章の4行目の5文字目から7文字目の「dic」の読み方を示す情報として「辞書」を付与した事例を示す。これにより4行目の5文字目から7文字目の「dic」の読み方は、「ディック」等ではなく「辞書」の読み方となる。
6番目のレコードは、文書IDが101の文書情報(図5参照)に含まれる文章の3行目の4文字目の後にロングポーズ(属性「ポーズ」、属性値「ロング」)を付与した事例を示す(図5の記号21参照)。同様に、7番目のレコードは、文書IDが101の文書情報(図5参照)に含まれる文章の3行目の9文字目の後にロングポーズ(属性「ポーズ」、属性値「ロング」)を付与した事例を示す(図5の記号22参照)。ポーズは読み上げ時の間を表し、ロングポーズは例えば0.9秒であり、ショートポーズは例えば0.3秒である。
図1に戻り、作成部1は修正済み文書情報11の各レコードにより示される各々の修正事例を比較し、同様の修正を1つの形式にまとめることにより修正パターン情報12を作成する。ここで複数の修正事例から修正パターン情報12を作成する具体例について説明する。
図6は複数の修正事例から修正パターンを作成する具体例1を示す図である。図6上段の表は2つの修正事例を示す。また図6下段の表は上段の2つの修正事例から作成された1つの修正パターンを示す。図6上段の1番目の修正事例では、表層表現60の読み上げ時の間について、カタカナ表記61と記号「・」との間にショートポーズ(記号23)を挿入し、カタカナ表記62と「作・絵」との題にロングポーズ(記号24)を挿入している。また図6上段の2番目の修正事例では、表層表現66の読み上げ時の間について、カタカナ表記63と記号「・」との間にショートポーズ(記号25)を挿入し、カタカナ表記64と記号「・」との間にショートポーズ(記号26)を挿入し、カタカナ表記65と「作」との題にロングポーズ(記号27)を挿入している。
図6上段の2つの修正事例は修正の仕方に同一の規則性があるため、図6上段の2つの表層表現は図6下段の修正パターン「$カナ・$カナ “作・絵|作”」にまとめることができる。ここで「$カナ」は任意のカタカナ文字列を表す。また「“作・絵|作”」は、「“作・絵”」又は「“作”」を表す。また図6上段の2つの属性値は図6下段の属性値28にまとめることができる。属性値28は「$カナ」と「・」との間にショートポーズを挿入し、「$カナ」と「“作・絵|作”」との間にロングポーズを挿入する修正の仕方を表す。
図7は複数の修正事例から修正パターンを作成する具体例2を示す図である。図7上段の表は6つの修正事例を示す。また図7下段の表は上段の6つの修正事例から作成された修正パターンを示す。図7下段の修正パターンは、一の修正パターンに2種類の属性及び属性値が関連付けられる場合の例である。
図7上段の1番目の修正事例は、表層表現「ステップ1…電源ボタンを押しながらロックボタンを5秒以上長押しします。」に含まれる「ステップ1…」の読み方を「ステップ1では、次の操作を行います。」に修正した事例である。また図7上段の2番目の修正事例は、表層表現「ステップ2…“ピー”という音が3回なったら手を離します。」に含まれる「ステップ2…」の読み方を「ステップ2では、次の操作を行います。」に修正した事例である。また図7上段の3番目の修正事例は、表層表現「ステップ3…“モードボタン”を2回押して、現在のステータスが表示…」に含まれる「ステップ3…」の読み方を「ステップ3では、次の操作を行います。」に修正した事例である。
図7上段の4〜6番目の修正事例は、実施形態の音訳作業支援装置100で出力対象としているデータ形式の一つであるDAISY(Digital Accessible Information SYstem)フォーマットに関する修正事例である。DAISYフォーマットでは、一般的なHTML要素に加えて、階層定義及びページ情報を明示的に指定することが特徴である。
図7上段の4番目の修正事例は、表層表現「ステップ1…電源ボタンを押しながらロックボタンを5秒以上長押しします。」のDaisyLevelを3に修正した事例である。具体的には、DAISYにおける階層定義(1〜6のいずれか)を付与するsetDaisyLevelの引数に3を指定することにより階層定義を行う。4番目の修正事例では、表層表現「ステップ1…電源ボタンを押しながらロックボタンを5秒以上長押しします。」の行にレベル3の値が付与される。同様に、図7上段の5番目の修正事例は、表層表現「ステップ2…“ピー”という音が3回なったら手を離します。」のDaisyLevelを3に修正した事例である。同様に、図7上段の6番目の修正事例では、表層表現「ステップ3…“モードボタン”を2回押して、現在のステータスが表示…」のDaisyLevelを3に修正した事例である。
図7上段の1〜3番目の修正事例は修正の仕方に同一の規則性があるため、図7上段の1〜3番目の表層表現は図7下段の修正パターン「“ステップ”(+数字)・・・($TEXT)」にまとめることができる。ここで「(+数字)」は任意の数字を表す。また「($TEXT)」は任意の文字列を表す。また図6上段の1〜3番目の属性値は図6下段の1番目の属性値「“ステップ”%dでは、次の操作を行います。$TEXT」にまとめることができる。「%d」は、図7下段の修正パターンに一致する表層表現の「ステップ」の後ろに続く数字を表す。「$TEXT」は、図7下段の修正パターンに一致する表層表現「・・・」の後ろに続く文字列を表す。
同様に、図7上段の4〜6番目の修正事例は修正の仕方に同一の規則性があるため、図7上段の4〜6番目の表層表現は図7下段の修正パターン「“ステップ”(+数字)・・・($TEXT)」にまとめることができる。
次に図6及び図7に示すような方法によって作成部1により作成された修正パターンを記憶する修正パターン情報12について説明する。図8は実施形態の修正パターン情報12の例を示す図である。修正パターン情報12は、例えば図8に示されるようなスキーマを有するRDBMS(Relational DataBase Management System)等により記憶される。修正パターン情報12は、修正パターンID、文書ID、修正パターン、属性、属性値、優先度及び出現頻度のフィールドを含む。
修正パターンIDは修正パターン情報12のレコードを一意に識別する識別情報である。文書IDは文書情報を一意に識別する識別情報である。修正パターンは、修正の仕方に同一の規則性がある複数の表層表現を正規表現等により表すことにより、1つの形式でまとめて表した表現である。なお表層表現を正規表現等でまとめて表すことができない場合、修正パターンは表層表現そのものである。属性は修正の種類を示す。属性値は修正の仕方を示す。優先度は一の修正パターンに、同一の属性の修正(属性値)が複数関連付けられている場合に設定される。優先度の値が小さいレコードの属性値ほど優先的に参照される。出現頻度は修正パターンが表層表現そのものである場合に設定される。出現頻度は当該レコードの属性及び属性値により特定される修正を行った表層表現の数、及び文書IDが付与されている全ての文書情報に含まれる当該表層表現の数を示す。作成部1は出願頻度に基づいて優先度を設定してもよい。作成部1は、例えば出現頻度が高いほど優先度を高く設定してもよい。
修正パターン情報12の各レコードについて具体的に説明する。修正パターンID1により特定される1番目のレコードは、文書IDが1の文書情報に含まれる修正パターン「DB」に、属性「よみ」及び属性値「データベース」により特定される修正を行った事例を示す。また、この修正事例の優先度は1である。また「DB」の出現頻度は「TF=15(230)」であることを示す。これは「DB」は全文書中で230箇所出現し、そのうち文書IDが1の文書情報の15箇所で「DB」の読み方が「データベース」に修正されたことを示す。
修正パターンID2により特定される2番目のレコードは、文書IDが900の文書情報に含まれる修正パターン「DB」に、属性「よみ」及び属性値「どらごんばとる」により特定される修正を行った事例を示す。また、この修正事例の優先度は2である。また「DB」の出現頻度は「TF=3(230)」であることを示す。これは「DB」は全文書中で230箇所出現し、そのうち文書IDが900の文書情報の3箇所で「DB」の読み方が「どらごんばとる」に修正されたことを示す。
修正パターンID3により特定される3番目のレコードは、文書IDが10の文書情報に含まれる修正パターン「db」に、属性「よみ」及び属性値「でしべる」により特定される修正を行った事例を示す。また、この修正事例の優先度は設定されていない。また「db」の出現頻度は「TF=5(10)」であることを示す。これは「db」は全文書中で10箇所出現し、そのうち文書IDが10の文書情報の5箇所で「db」の読み方が「でしべる」に修正されたことを示す。
修正パターンID4により特定される4番目のレコードは、文書IDが1020の文書情報に含まれる修正パターン「DataBase」に、属性「よみ」及び属性値「データベース」により特定される修正を行った事例を示す。また、この修正事例の優先度は設定されていない。また「DataBase」の出現頻度は「TF=12(123)」であることを示す。これは「DataBase」は全文書中で123箇所出現し、そのうち文書IDが1020の文書情報の12箇所で「DataBase」の読み方が「データベース」に修正されたことを示す。
修正パターンID5により特定される5番目のレコードは、文書IDが101の文書情報に含まれる修正パターン31に、属性「ポーズ」及び属性値32により特定される修正を行った事例を示す。また、この修正事例の優先度及び出現頻度は、修正パターンが表層表現そのものではないため設定されていない。修正パターン31及び属性値32に含まれている「$NE」は任意の固有表現(named entity)を示す。固有表現は、例えば人名である。
修正パターンID6により特定される6番目のレコードは、文書IDが133の文書情報に含まれる修正パターン33に、属性「ポーズ」及び属性値34により特定される修正を行った事例を示す。6番目のレコードは上述の図6を参照して説明した事例に対応する。
音訳作業支援装置100は修正パターン情報12を、文書情報のタイプ(種類)毎に記憶する。これは一般に、文書情報の種類に応じて修正パターン(修正対象の表層表現)、及び、修正の仕方を示す属性値は異なるためである。文書情報のタイプは、例えば「図書目録」や、「マニュアル」等である。
図1に戻り、入力部2は文書情報を受け付ける。入力部2は受け付けた文書情報を抽出部3に入力する。抽出部3は文書情報のタイプ毎に記憶されている全ての修正パターン情報12の修正パターンを参照し、文書情報のタイプ毎に修正パターンに一致する文書情報の表層表現を修正箇所として抽出する。また抽出部3は修正箇所の抽出に使用された修正パターンを含むレコードを修正パターン情報12から取得する。そして抽出部3は文書情報のタイプ毎に抽出した修正箇所、及び、修正箇所の抽出に使用された修正パターン情報12の修正パターンを含むレコードを提示部4に入力する。また抽出部3は入力部2から受信した文書情報を提示部4に入力する。
提示部4は文書情報の修正箇所と、文書情報の修正箇所の抽出に使用された修正パターンに関連付けられた属性値(修正の仕方)と、を修正候補として提示する。受付部5は提示部4により提示された修正候補の選択を受け付ける。修正部6は受付部5により受け付けられた選択に応じて文書情報の修正箇所を修正する。修正部6は、修正箇所の音訳の仕方を修正する場合は、当該修正箇所(文書情報に含まれる語句及び記号等)の音訳の仕方を音訳補助情報(メタデータ)として記憶する。音訳補助情報を文書情報とともに音声合成エンジンに入力することにより、音訳補助情報に応じた所望の音声データを得ることができる。ここで提示部4が提示する修正候補の具体例について説明する。
図9は実施形態の提示部4が提示する修正候補の具体例1を示す図である。一般に文書タイプ(文書の種類)に応じて適切な修正候補が変わるため、提示部4は文書タイプに応じて提示する修正候補を変更する。更に提示部4は属性(修正の種類)に応じて提示する修正候補を変更する。具体的には、提示部4は受付部5により受け付けられた文書タイプ及び属性に応じて提示する修正候補を変更する。図9は文書タイプが「図書目録」であり、修正の種類の示す属性が「ポーズ」である場合に、修正箇所44及び属性値41〜43を修正候補として提示する場合の例である。図9の例は、プルダウンメニューから候補1〜候補3のいずれか1つを選択することにより、修正箇所44のポーズ情報を修正する。受付部5がプルダウンメニューにより候補1の選択を受け付けた場合、修正部6が属性値41の修正を修正箇所44に適用する。また受付部5がプルダウンメニューにより候補2の選択を受け付けた場合、修正部6が属性値42の修正を修正箇所44に適用する。また受付部5がプルダウンメニューにより候補3の選択を受け付けた場合、修正部6が属性値43の修正を修正箇所44に適用する。
図10は実施形態の提示部4が提示する修正候補の具体例2を示す図である。図10は文書タイプが「マニュアル」であり、修正の種類の示す属性が「DAISYメタデータ[ページ]」である場合に、修正箇所54及び属性値51〜53を修正候補として提示する場合の例である。図10の例は、プルダウンメニューから候補1〜候補3のいずれか1つを選択することにより、修正箇所54のページに関するDAISYメタデータを修正する。受付部5がプルダウンメニューにより候補1の選択を受け付けた場合、修正部6が属性値51の修正を修正箇所54に適用する。すなわちページの表記を「p19」とし、当該ページに関するメタデータとして、「span id =”x023”」及び「class=”page−normal”」を付与する。また受付部5がプルダウンメニューにより候補2の選択を受け付けた場合、修正部6が属性値52の修正を修正箇所54に適用する。すなわちページの表記を「19ページ」とし、当該ページに関するメタデータとして、「span id =”x023”」及び「class=”page−normal”」を付与する。また受付部5がプルダウンメニューにより候補3の選択を受け付けた場合、修正部6が属性値53の修正を修正箇所54に適用する。すなわちページの表記を「19」とし、当該ページに関するメタデータとして、「span id =”x023”」及び「class=”page−normal”」を付与する。
図1に戻り、修正部6は文書情報の修正箇所を修正し、文書情報及び音訳補助情報を出力部7に入力する。出力部7は当該文書情報及び当該音訳補助情報を所定のデータ形式により出力する。所定のデータ形式は音声合成エンジンに入力可能な文書情報及び音訳補助情報のデータ形式である。
次に実施形態の音訳作業支援方法について説明する。図11は実施形態の音訳作業支援方法の全体フローの例を示す図である。実施形態の音訳作業支援方法は、修正パターンの作成処理(ステップS1)、及び修正箇所の抽出、修正候補の提示、及び修正処理(ステップS2)を含む。まず修正パターンの作成処理(ステップS1)について説明する。
図12A及びBは実施形態の修正パターンの作成処理の例を示す図である。まず作成部1は、修正済み文書情報11から処理対象のレコードを読み出す(ステップS11)。処理対象のレコードは修正済み文書情報11の全部のレコードであっても、一部のレコードであってもよい。次に作成部1はステップS11により読み出したレコードの表層表現フィールドの情報を抽出する(ステップS12)。次に作成部1はステップS12で抽出した表層表現の形態素解析及び固有表現の特定を行う(ステップS13)。ステップS13の処理結果は表層表現の比較処理(後述のステップS15)に利用される。次に作成部1は処理対象の全てのレコードの表層表現を抽出したか否かを判定する(ステップS14)。
処理対象の全てのレコードの表層表現を抽出していない場合(ステップS14、No)、処理はステップS12に戻る。処理対象の全てのレコードの表層表現を抽出した場合(ステップS14、Yes)、作成部1は抽出した表層表現を互いに比較する(ステップS15)。そして作成部1は表層表現の一部又は全部を正規表現等でまとめて表すことにより、表層表現をパターン化できるか否かを判定する(ステップS16)。パターン化できる場合(ステップS16、Yes)、作成部1は表層表現の一部又は全部を正規表現等でまとめて表すことにより、複数の表層表現を1つの形式でまとめて表した修正パターンを作成する(ステップS17)。パターン化できない場合(ステップS16、No)、処理はステップS18に進む。
次に作成部1は処理対象の全てのレコードの表層表現を比較したか否かを判定する(ステップS18)。処理対象の全てのレコードの表層表現を比較していない場合(ステップS18、No)、処理はステップS15に戻る。
処理対象の全てのレコードの表層表現を比較した場合(ステップS18、Yes)、作成部1は修正パターン(表層表現を一の形式にまとめることができない場合は表層表現そのもの)が同一のレコードの組み合わせ毎に、属性フィールドの情報を抽出する(ステップS19)。次に作成部1はステップS19で抽出した属性を互いに比較する(ステップS20)。次に作成部1は属性が同一のレコードがあるか否かを判定する(ステップS21)。属性が同一のレコードがない場合(ステップS21、No)、処理はステップS27に進む。
属性が同一のレコードがある場合(ステップS21、Yes)、属性が同一のそれぞれのレコードの属性値フィールドの情報を抽出する(ステップS22)。次に作成部1はステップS22で抽出した属性値を互いに比較する(ステップS23)。そして作成部1は属性値の一部又は全部を正規表現等でまとめて表すことにより、属性値をパターン化できるか否かを判定する(ステップS24)。パターン化できる場合(ステップS24、Yes)、作成部1は属性値の一部又は全部を正規表現等でまとめて表すことにより、複数の属性値を1つの形式でまとめて表す(ステップS25)。パターン化できない場合(ステップS24、No)、処理はステップS26に進む。
次に作成部1は修正パターン(表層表現を一の形式にまとめることができない場合は表層表現そのもの)、属性(修正の種類)、及び属性値(修正の仕方)の組み合わせのうち、修正パターン及び属性が同一で、属性値が異なる組み合わせについて優先度を付与する(ステップS26)。優先度は、例えば提示部4が属性値を修正候補として提示する際の順序の決定等に利用される。
次に作成部1は修正パターン(表層表現を一の形式にまとめることができない場合は表層表現そのもの)が同一のレコードの組み合わせ毎に、当該組み合わせに含まれる属性を全て比較したか否かを判定する(ステップS27)。当該組み合わせに含まれる属性を全て比較していない場合(ステップS27、No)、処理はステップS20に戻る。当該組み合わせに含まれる属性を全て比較した場合(ステップS27、Yes)、処理は終了する。
図11に戻り、次に修正箇所の抽出、修正候補の提示、及び修正処理(ステップS2)について説明する。図13は実施形態の修正箇所の抽出、修正候補の提示及び修正処理の例を示す図である。まず入力部2は文書情報の入力を受け付ける(ステップS31)。次に受付部5は文書情報のタイプ(種類)毎に記憶された修正パターン情報12の修正パターンを使用して、文書情報の種類毎に修正箇所を抽出する(ステップS32)。
次に受付部5は文書情報の種類を受け付ける(ステップS33)。次に受付部5は属性を受け付ける(ステップS34)。次に提示部4はステップS33で受け付けた文書情報の種類に基づいて修正箇所及び修正候補を提示する(ステップS35)。具体的には、提示部4はステップS33で受け付けた文書情報の種類に、最も類似する文書情報の種類の修正パターン情報12の修正パターンにより抽出された修正箇所を提示する。提示部4は修正箇所を下線、文字列(数字や記号等を含む)の色・フォントの変更、又は背景のハイライト等により強調(マーキング)して提示する。このとき提示部4は修正箇所の強調の仕方を属性(修正の種類)により変更してもよい。提示部4は当該修正パターンに関連付けられた属性値を修正候補として提示する。
次に受付部5は修正候補の選択を受け付けたか否かを判定する(ステップS36)。修正候補の選択を受け付けた場合(ステップS36、Yes)、修正部6は選択された修正候補に応じた修正を、文書情報に行う(ステップS37)。このとき修正部6は、修正箇所の音訳の仕方を修正する場合は、当該修正箇所(文書情報に含まれる語句及び記号等)の音訳の仕方を音訳補助情報(メタデータ)として記憶する。次に提示部4はステップS37により修正された箇所を強調(マーキング)することにより明示する(ステップS38)。修正候補の選択を受け付けなかった場合(ステップS36、No)、修正部6による修正を行わずに当該修正箇所の修正処理を終了する。
以上説明したように実施形態の音訳作業支援装置100は、修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンと、修正の種類を示す属性と、修正の仕方を示す属性値と、が関連付けられた修正パターン情報12を記憶する。そして抽出部3が修正パターンに一致する文書情報の表層表現を修正箇所として抽出し、提示部4が文書情報の修正箇所と、文書情報の修正箇所の抽出に使用された修正パターンに関連付けられた属性値(修正の仕方)を、修正候補として提示する。これにより修正箇所と修正の仕方とを把握することができるので文書情報の音訳作業を効率的に行うことができる。
また音声合成エンジンにより作成された音声データは、文書情報の種類に応じたきめ細かな修正が必要だが、実施形態の音訳作業支援装置100は、修正された表層表現そのものの履歴情報の流用に留まらず、特に上述の修正パターンに基づいて修正候補を提示する。そのため表層表現は同一ではないが、体裁や構造が類似する表層表現の音訳作業に、過去に修正された文書情報の音訳作業の履歴を活用することができるので文書情報の音訳作業を効率的に行うことができる。
<実施形態の変形例>
上述の実施形態の音訳作業支援装置100では、抽出部3が過去の修正履歴から作成された修正パターンを使用して修正箇所を抽出した。しかしながら抽出部3は過去の修正履歴から作成された修正パターンによらない標準修正パターンを使用して修正箇所を抽出してもよい。実施形態の変形例では、音訳作業支援装置100が標準修正パターン情報を使用して修正候補を提示することにより音訳作業を支援する場合について説明する。
上述の実施形態の音訳作業支援装置100では、抽出部3が過去の修正履歴から作成された修正パターンを使用して修正箇所を抽出した。しかしながら抽出部3は過去の修正履歴から作成された修正パターンによらない標準修正パターンを使用して修正箇所を抽出してもよい。実施形態の変形例では、音訳作業支援装置100が標準修正パターン情報を使用して修正候補を提示することにより音訳作業を支援する場合について説明する。
図14は実施形態の変形例の標準修正パターン情報の例を示す図である。より具体的には、図14の例は抽出部3が文書ID「301」の文書情報を、標準修正パターン情報を使用して抽出した情報の例を示す。標準修正パターン情報を使用して抽出した情報は、例えば図14に示されるようなスキーマを有するRDBMS(Relational DataBase Management System)等により記憶される。標準修正パターン情報は、修正パターンID、文書ID、修正パターン、属性、属性値、優先度及び出現頻度のフィールドを含む。標準修正パターン情報のスキーマは上述の修正パターン情報と同じなので説明を省略する。標準修正パターン情報の各レコードについて具体的に説明する。
修正パターンID「D1」により特定される1番目のレコードは、文書IDが「301」の文書情報に、インデント数(行頭のスペース数)が0の行が含まれていることを示す。同様に修正パターンID「D2」により特定される2番目のレコードは、文書IDが「301」の文書情報に、インデント数(行頭のスペース数)が4の行が含まれていることを示す。
修正パターンID「D3」により特定される3番目のレコードは、文書IDが「301」の文書情報に、箇条書き(・記号や、1,2,3,という連番の冒頭記号の連続)による記載が3箇所含まれていることを示す。
修正パターンID「D4」により特定される4番目のレコードは、文書IDが「301」の文書情報に、フォントの変更の記載が8箇所含まれていることを示す。修正パターンID「D4」により特定される4番目のレコードの属性値では、例えば文書情報のタグ情報(HTML文書の<h1>タグや<b>タグ等)により、文字の大きさや太さなどの装飾が行われている回数が検出されている。
修正パターンID「D5」により特定される5番目のレコードは、文書IDが「301」の文書情報に、URLの記載が3箇所含まれていることを示す。
修正パターンID「D6」により特定される6番目のレコードは、文書IDが「301」の文書情報に、人名や地名等の固有表現の記載が17箇所含まれていることを示す。
実施形態の変形例の提示部4は、修正パターンID「D1」〜「D6」により特定される属性を提示することにより、ユーザが必要に応じて当該属性に関する修正箇所を一括で修正できるようにする。図14の例の場合、例えば提示部4は、文書IDが「301」の文書情報に2種類のインデントの仕方(0文字及び4文字)があることを提示する。これにより音訳作業支援装置100のユーザはインデントの仕方を統一する等の修正を一括で行うことができる。また提示部4は、文書IDが「301」の文書情報にURLの記載が3箇所あることを提示する。これにより音訳作業支援装置100のユーザはURLの記載にハイパーリンクタグ(<a href=../>)を掛ける修正を一括で行うことができる。また提示部4は、文書IDが「301」の文書情報に固有表現の記載が17箇所あることを提示する。これにより音訳作業支援装置100のユーザは固有表現の読み上げをゆっくり、大きな声で読むという音声合成の指定タグを掛ける(<prosody pitch=“+1” voice=“+10”>)という修正を一括で行うことができる。
以上説明したように、実施形態の変形例の音訳作業支援装置100は、過去の修正事例による修正パターンに応じた修正候補だけでなく、標準的に修正の対象となる修正箇所を更に提示するので文書情報の音訳作業を効率的に行うことができる。
最後に実施形態の音訳作業支援装置100のハードウェア構成について説明する。図15は実施形態の音訳作業支援装置100のハードウェア構成の例を示す図である。
本実施形態の音訳作業支援装置100は、制御装置71、主記憶装置72、補助記憶装置73、表示装置74、入力装置75及び通信装置76を備える。制御装置71、主記憶装置72、補助記憶装置73、表示装置74、入力装置75及び通信装置76は、バス77を介して互いに接続されている。
制御装置71は、補助記憶装置73から主記憶装置72に読み出されたプログラムを実行する。主記憶装置72は、ROM(Read Only Memory)やRAM(Random Access Memory)等のメモリである。補助記憶装置73は、例えばハードディスクやメモリカード等である。表示装置74は、音訳作業支援装置100の状態等を表示する画面である。表示装置74は、例えば液晶ディスプレイ等である。入力装置75は、音訳作業支援装置100を操作するためのインタフェースである。入力装置75は、例えばキーボードやマウス等である。通信装置76は、ネットワークに接続するためのインタフェースである。
本実施形態の音訳作業支援装置100で実行されるプログラムを、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、メモリカード、CD−R及びDVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録し、コンピュータ・プログラム・プロダクトとして提供してもよい。また、本実施形態の音訳作業支援装置100で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供してもよい。また、本実施形態の音訳作業支援装置100で実行されるプログラムをダウンロードさせずに、インターネット等のネットワーク経由で提供、又は配布してもよい。また、本実施形態の音訳作業支援装置100のプログラムを、ROM等に予め組み込んで提供してもよい。
本実施形態の音訳作業支援装置100で実行されるプログラムは、上述した音訳作業支援装置100の各機能ブロックのうち、プログラムとしても実現可能な機能ブロック(作成部1、入力部2、抽出部3、提示部4、受付部5、修正部6及び出力部7)を含むモジュール構成となっている。
当該モジュールは、実際のハードウェアとしては、制御装置71が上記記憶媒体からプログラムを読み出して実行することにより、上記各モジュールが主記憶装置72上にロードされる。すなわち、上記各モジュールは、主記憶装置72上に生成される。なお、音訳作業支援装置100の各機能ブロックの一部、又は全部を、プログラムにより実現せずに、IC(Integrated Circuit)等のハードウェアにより実現してもよい。
Claims (8)
- 文書情報を入力する入力部と、
修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンに一致する前記文書情報の表層表現を修正箇所として抽出する抽出部と、
前記修正箇所の抽出に使用された前記修正パターンに応じて定められた修正の仕方を提示する提示部と、
前記修正の仕方の選択を受け付ける受付部と、
選択された前記修正の仕方に基づいて前記修正箇所を修正する修正部と、
を備える音訳作業支援装置。 - 前記文書情報の修正履歴から前記修正パターンと、前記修正の仕方と、が関連付けられた修正パターン情報を作成する作成部を更に備え、
前記抽出部は、前記修正パターン情報の修正パターンに一致する前記文書情報の表層表現を修正箇所として抽出し、
前記提示部は、前記修正箇所の抽出に使用された前記修正パターン情報の修正パターンに関連付けられた修正の仕方を提示する
請求項1に記載の音訳作業支援装置。 - 前記修正パターンと、前記修正パターンに応じて定められた修正の仕方と、は前記文書情報の種類毎に定められ、
前記抽出部は、前記入力部に入力された前記文書情報の種類と最も類似する前記文書情報の種類の修正パターンを使用して前記文書情報の修正箇所を抽出する
請求項1に記載の音訳作業支援装置。 - 前記提示部は、前記文書情報の修正箇所を強調して提示する
請求項1に記載の音訳作業支援装置。 - 前記受付部は、前記修正の種類を更に受け付け、
前記提示部は、前記修正箇所の抽出に使用された前記修正パターンに応じて定められた修正の仕方を前記修正の種類に応じて提示する
請求項1に記載の音訳作業支援装置。 - 前記提示部は、前記文書情報の修正箇所の強調の仕方を前記修正の種類に応じて変更する
請求項5に記載の音訳作業支援装置。 - 入力部が、文書情報を入力するステップと、
抽出部が、修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンに一致する前記文書情報の表層表現を修正箇所として抽出するステップと、
提示部が、前記修正箇所の抽出に使用された前記修正パターンに応じて定められた修正の仕方を提示するステップと、
受付部が、前記修正の仕方の選択を受け付けるステップと、
修正部が、選択された前記修正の仕方に基づいて前記修正箇所を修正するステップと、
を含む音訳作業支援方法。 - コンピュータを、
文書情報を入力する入力部と、
修正の仕方に同一の規則性のある複数の表層表現を一の形式で表した修正パターンに一致する前記文書情報の表層表現を修正箇所として抽出する抽出部と、
前記修正箇所の抽出に使用された前記修正パターンに応じて定められた修正の仕方を提示する提示部と、
前記修正の仕方の選択を受け付ける受付部と、
選択された前記修正の仕方に基づいて前記修正箇所を修正する修正部、
として機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/061486 WO2015162737A1 (ja) | 2014-04-23 | 2014-04-23 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2015162737A1 true JPWO2015162737A1 (ja) | 2017-04-13 |
Family
ID=54331926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016514624A Pending JPWO2015162737A1 (ja) | 2014-04-23 | 2014-04-23 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10089975B2 (ja) |
JP (1) | JPWO2015162737A1 (ja) |
WO (1) | WO2015162737A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6392445B2 (ja) | 2015-03-24 | 2018-09-19 | 株式会社東芝 | 音訳支援装置、音訳支援方法及び音訳支援プログラム |
JP6523998B2 (ja) * | 2016-03-14 | 2019-06-05 | 株式会社東芝 | 読み上げ情報編集装置、読み上げ情報編集方法およびプログラム |
CN107437413B (zh) * | 2017-07-05 | 2020-09-25 | 百度在线网络技术(北京)有限公司 | 语音播报方法及装置 |
US11961094B2 (en) * | 2020-11-15 | 2024-04-16 | Morgan Stanley Services Group Inc. | Fraud detection via automated handwriting clustering |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107470A (ja) * | 1984-10-31 | 1986-05-26 | Toshiba Corp | 文書編集装置 |
JPH06110887A (ja) * | 1992-09-25 | 1994-04-22 | Fujitsu Ltd | 文書校正処理装置 |
JPH07295983A (ja) * | 1994-04-25 | 1995-11-10 | Sharp Corp | 文章校正支援方法及びその装置 |
JP2009110497A (ja) * | 2007-10-12 | 2009-05-21 | Ricoh Co Ltd | 情報処理装置、画像形成装置、プログラム、文書データ構成方法 |
JP2011170191A (ja) * | 2010-02-19 | 2011-09-01 | Fujitsu Ltd | 音声合成装置、音声合成方法、及び音声合成プログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3270356B2 (ja) | 1996-12-04 | 2002-04-02 | 株式会社ジャストシステム | 発話文書作成装置,発話文書作成方法および発話文書作成手順をコンピュータに実行させるプログラムを格納したコンピュータ読み取り可能な記録媒体 |
US7412385B2 (en) * | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
US7908132B2 (en) * | 2005-09-29 | 2011-03-15 | Microsoft Corporation | Writing assistance using machine translation techniques |
JP4859101B2 (ja) | 2006-01-26 | 2012-01-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストに付与する発音情報の編集を支援するシステム |
JP5031270B2 (ja) | 2006-05-31 | 2012-09-19 | キヤノン株式会社 | データ修正支援装置及び方法、並びにプログラム及び記憶媒体 |
JP5267450B2 (ja) | 2009-12-28 | 2013-08-21 | 株式会社デンソー | 電子機器及びプログラム |
US8688435B2 (en) | 2010-09-22 | 2014-04-01 | Voice On The Go Inc. | Systems and methods for normalizing input media |
JP2012198277A (ja) | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
WO2015052817A1 (ja) | 2013-10-10 | 2015-04-16 | 株式会社東芝 | 音訳作業支援装置、音訳作業支援方法及びプログラム |
-
2014
- 2014-04-23 JP JP2016514624A patent/JPWO2015162737A1/ja active Pending
- 2014-04-23 WO PCT/JP2014/061486 patent/WO2015162737A1/ja active Application Filing
-
2016
- 2016-09-16 US US15/268,356 patent/US10089975B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61107470A (ja) * | 1984-10-31 | 1986-05-26 | Toshiba Corp | 文書編集装置 |
JPH06110887A (ja) * | 1992-09-25 | 1994-04-22 | Fujitsu Ltd | 文書校正処理装置 |
JPH07295983A (ja) * | 1994-04-25 | 1995-11-10 | Sharp Corp | 文章校正支援方法及びその装置 |
JP2009110497A (ja) * | 2007-10-12 | 2009-05-21 | Ricoh Co Ltd | 情報処理装置、画像形成装置、プログラム、文書データ構成方法 |
JP2011170191A (ja) * | 2010-02-19 | 2011-09-01 | Fujitsu Ltd | 音声合成装置、音声合成方法、及び音声合成プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2015162737A1 (ja) | 2015-10-29 |
US20170004822A1 (en) | 2017-01-05 |
US10089975B2 (en) | 2018-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6505421B2 (ja) | 情報抽出支援装置、方法およびプログラム | |
WO2006046523A1 (ja) | 文書解析システム、及び文書適応システム | |
US10089975B2 (en) | Transliteration work support device, transliteration work support method, and computer program product | |
JP6290230B2 (ja) | 音訳作業支援装置、音訳作業支援方法及びプログラム | |
JP2014240884A (ja) | コンテンツ作成支援装置、方法およびプログラム | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
CN102262617B (zh) | 一种书版小样处理方法及装置 | |
JP2008027290A (ja) | 日本語文作成支援方法及びその装置 | |
JP6249760B2 (ja) | テキスト読み上げ装置 | |
JP2002189740A (ja) | データ変換システム | |
US10373606B2 (en) | Transliteration support device, transliteration support method, and computer program product | |
US20060031072A1 (en) | Electronic dictionary apparatus and its control method | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP5748118B2 (ja) | ドキュメント作成支援方法とドキュメント作成支援装置とドキュメント作成支援プログラム | |
KR100709379B1 (ko) | 메타파일을 이용한 문서양식 제작방법 | |
JPH0877179A (ja) | 文書索引生成装置 | |
JPH09258763A (ja) | 音声合成装置 | |
JPH11272708A (ja) | 文書作成支援システム | |
van Lit | Philology: Standards for Digital Editing | |
JP6424920B2 (ja) | 情報処理装置、情報検索方法、及びプログラム | |
JP6451153B2 (ja) | 情報表示制御装置およびプログラム | |
JPH05135054A (ja) | 文書処理方法 | |
KR101008493B1 (ko) | 콘텐츠의 편집 방법 및 그 방법을 실행하는 프로그램을기록한 기록매체 | |
JP3838507B2 (ja) | 文章読み上げ装置、読み上げのためのプログラム、及び、記録媒体 | |
CN116153289A (zh) | 语音合成标记文本的处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171211 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180522 |