JP2005176083A - 字幕番組データ制作システムにおける自動ルビ付与装置 - Google Patents
字幕番組データ制作システムにおける自動ルビ付与装置 Download PDFInfo
- Publication number
- JP2005176083A JP2005176083A JP2003415240A JP2003415240A JP2005176083A JP 2005176083 A JP2005176083 A JP 2005176083A JP 2003415240 A JP2003415240 A JP 2003415240A JP 2003415240 A JP2003415240 A JP 2003415240A JP 2005176083 A JP2005176083 A JP 2005176083A
- Authority
- JP
- Japan
- Prior art keywords
- ruby
- kanji
- reading
- automatic
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Studio Circuits (AREA)
- Studio Devices (AREA)
Abstract
【課題】 簡単な操作によって所望の漢字にルビを自動付与することを可能にする。
【解決手段】 ルビの付与ルールを定めたルビ付与ルール記憶部11と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部13と、表示対象となる字幕用テキストを形態素解析する形態素解析部15と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部11から選択されたルビ付与ルールとルビ付与漢字リスト記憶部13から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部17とを備える。
【選択図】 図1
【解決手段】 ルビの付与ルールを定めたルビ付与ルール記憶部11と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部13と、表示対象となる字幕用テキストを形態素解析する形態素解析部15と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部11から選択されたルビ付与ルールとルビ付与漢字リスト記憶部13から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部17とを備える。
【選択図】 図1
Description
本発明は、字幕番組データ中の漢字にルビを自動付与する自動ルビ付与装置に関する。
[発明の概要]
本発明は、字幕番組データ制作におけるルビ付与作業の改善に関するものであり、特にルビを付与すべき漢字の複数リストであるルビ付与漢字リストと、ルビの種々の付与法を定めたルビ付与ルールとを備え、形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて選択したルビ付与ルールのルビ付与法とそのルビ付与漢字リストによって、該当する漢字にルビを自動付与するものである。
本発明は、字幕番組データ制作におけるルビ付与作業の改善に関するものであり、特にルビを付与すべき漢字の複数リストであるルビ付与漢字リストと、ルビの種々の付与法を定めたルビ付与ルールとを備え、形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて選択したルビ付与ルールのルビ付与法とそのルビ付与漢字リストによって、該当する漢字にルビを自動付与するものである。
対象素材番組に応じた適切なルビ付与ルールの選択とそのルールによるルビの自動付与により、ルビ付与作業を大幅に改善できるので、字幕番組制作の時間短縮、労力軽減に大きく寄与する。
字幕付きテレビ番組放送を受信者が利用する際、字幕が読み易く、理解し易いものであることが重要である。したがって、字幕番組制作における字幕原稿作成では、熟練した人手を使い、多大な労力と時間を掛けて、読み易くて理解し易い字幕を制作している。
しかしながら、今後適用番組の分野や番組数などの拡大が求められる字幕放送において、この熟練した人手、多大な労力と時間を要するこのような形態の字幕番組制作手法は、字幕番組制作上の大きなネックとなっている。
現在最も多く行われている字幕番組制作形態では、タイムコードを映像にスーパーした番組映像と番組音声などを素材とし、これを放送関係経験者など専門知識のある人によって、番組アナウンスの要約書起し(処理1)、次いで字幕表示イメージ化(処理2;この処理は所定の字幕原稿作成要領に基づく)、およびその開始・終了タイムコード記録(処理3)の各作業を行い、字幕データを作成している。この字幕データを担当の字幕制作責任者、原稿作成者、オペレータなどの立ち会いのもとで、試写・校正を行って完成字幕としている。
上述した処理1〜処理3の作業の中でより多くの時間を必要とするのは、処理1の番組スピーチの書起し作業であり、この作業では、番組スピーチを聴取して字幕原稿を作成するという点において最も人間の知能に負うところが多い。
特開2002−351490
ところで、番組スピーチの書起し作業の一貫としてカナ漢字混じりテキストの内、必要な漢字にルビを付与する作業がある。
従来の人手によるルビ付与作業について以下に説明する。
例えば、“聴覚障害者の方々にもテレビを健聴者と同じように楽しむ”という観点から番組の利用者層を想定して字幕にルビを付すことを考えた場合、字幕番組制作システムの画面上において、図7(A)に示すように、 先ず、ルビを入れたい漢字を指定する。図の例では、“健聴者”が指定されている。次いで、図8に示すように、画面上に文字(読み)を入力する。この場合には、“けんちょうしゃ”と入力する。
次に、図7(B)に示すように、ルビを入れるためにの空間を確保するために上下方向に1行(半角分)ずらす。また、入力した文字のサイズを縦横各1/2(=1/4角)にしたフォントを設定する。
最後に、ルビを入れたい該当する漢字の上に入力したルビを置く。このようにして、図7(B)に示すような手入力されたルビつき字幕が作成・表示される。
しかしながら、上述したように、字幕番組データ中の漢字にルビを付与する作業は、人間の手作業で行われており、全ての字幕データに対して前述したような手作業をするのは、作業者にとっては多大の労力と時間および能力を要することとなり、字幕番組の制作時間や労力を低減するために、その改善が急がれている。
本発明は、上記事情に鑑みてなされたものであり、簡単な操作によって所望の漢字にルビを自動付与することができる字幕番組データ制作システムにおける自動ルビ付与装置を提供することを目的としている。
上記の目的を達成するために請求項1の発明は、ルビの付与ルールを定めたルビ付与ルール記憶部と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部と、表示対象となる字幕用テキストを形態素解析する形態素解析部と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部から選択されたルビ付与ルールとルビ付与漢字リスト記憶部から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部とを備えたことを特徴としている。
請求項2の発明では、請求項1に記載の字幕番組データ制作システムにおける自動ルビ付与装置において、前記ルビ付与漢字リスト記憶部に記憶されるルビ付与漢字リストとしては、常用漢字および表外音訓表や教育漢字表(学年別配当漢字表)、人名漢字表の漢字が含まれることを特徴としている。
本発明によれば、作業者が手入力することなく、簡単な操作によって所望の漢字にルビを自動付与することができ、作業者の労力、時間、能力の大幅な低減に寄与することが可能となる。
本発明は、字幕番組データ制作におけるルビ付与作業の労力・時間を軽減するものであり、特にルビを付与すべき漢字リストであるルビ付与漢字リストと、ルビの種々の付与法を定めたルビ付与ルールとを備え、対象素材番組の分野などに応じて選択したルビ付与法のルビ付与ルールとそのルビ付与漢字リストによって、該当する漢字にルビを自動付与するものである。
その結果、対象素材番組に応じた適切なルビ付与ルールの選択とそのルールによるルビの自動付与により、ルビ付与作業を大幅に改善でき、字幕番組制作の時間の短縮、労力軽減などに大きく寄与する。
<実施例>
本発明に係る字幕番組データ制作システムにおける自動ルビ付与装置の一実施例を図面に基づいて説明する。図1は、字幕番組データ制作システムにおける自動ルビ付与装置の構成を示している。
本発明に係る字幕番組データ制作システムにおける自動ルビ付与装置の一実施例を図面に基づいて説明する。図1は、字幕番組データ制作システムにおける自動ルビ付与装置の構成を示している。
同図に示す自動ルビ付与装置10は、コンピュータのソフトウェアで構成することができ、その機能上、ルビの付与ルールを定めたルビ付与ルール記憶部11と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部13と、表示対象となる字幕用テキストを形態素解析する形態素解析部15と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部11から選択されたルビ付与ルールとルビ付与漢字リスト記憶部13から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部17とを備えている。
ルビ付与ルール記憶部11には、ルビの種々の付与法を定めたルビ付与ルールが記憶されている。字幕制作事業者などでは、一般に字幕番組制作要領などを設けており、実際の字幕データ作成作業におけるルビ付与に際し、その要領などに示される基準に沿って行われている。記憶されるルビ付与ルールの一例を以下に示す。
(1) 常用漢字以外の漢字には全てルビを付与する。
(2) 常用漢字であっても、表外音訓の場合はルビを付与する。
(3) 学校放送番組などでは、教育漢字表(学年別配当漢字表)を優先適用し、ルビを付与する。
(4) ルビを付与すべき漢字であっても、所定時間(所定回数)内に出現する同一漢字については初回のみルビを付与する。
(5) NHK編「新用字用語辞典」で認めている漢字はルビ不要とする。
(6) 都道府県、制令指定都市名にはルビ不要とする。
(7) 人名漢字は常用漢字でないので、ルビを付与する。
(8) 漢字にはすべてルビを付与しない。
(2) 常用漢字であっても、表外音訓の場合はルビを付与する。
(3) 学校放送番組などでは、教育漢字表(学年別配当漢字表)を優先適用し、ルビを付与する。
(4) ルビを付与すべき漢字であっても、所定時間(所定回数)内に出現する同一漢字については初回のみルビを付与する。
(5) NHK編「新用字用語辞典」で認めている漢字はルビ不要とする。
(6) 都道府県、制令指定都市名にはルビ不要とする。
(7) 人名漢字は常用漢字でないので、ルビを付与する。
(8) 漢字にはすべてルビを付与しない。
また、ルビ付与漢字リスト記憶部13には、例えば、ルビを付与すべき漢字の複数リストである以下のようなルビ付与漢字リストが記憶されている。
(1) 常用漢字
(2) 表外音訓表
(3) 教育漢字表(学年別配当漢字表)
(4) NHK編「新用字用語辞典」
(5) 人名漢字表
(6) その他、特定の漢字リスト
(2) 表外音訓表
(3) 教育漢字表(学年別配当漢字表)
(4) NHK編「新用字用語辞典」
(5) 人名漢字表
(6) その他、特定の漢字リスト
形態素解析部15は、漢字かな交じり文で表記されている入力された字幕用テキストを対象として、形態素毎に分割する分割機能と、分割機能を発揮することで分割された各形態素毎に、表現形、品詞、読み、標準表現などの付加情報を付与する付加情報付与機能を備えている。
自動ルビ付与部17は、外部からルビ付与指令が供給された場合に、対象素材番組が教育番組か娯楽番組か等、教育番組であれば何年生向けか等その分野などに応じて、ルビ付与ルール記憶部11からルビ付与ルールを選択すると共に、ルビ付与漢字リスト記憶部13から該当するルビ付与漢字リストを選択し、形態素解析部15によって形態素解析されて得られた読み付け情報を基にして字幕用テキスト中の該当する漢字にルビを自動付与する。
本発明によるルビ自動付与の処理手順を図2に基づいて説明する。
先ず、字幕制作担当者が当該番組素材を検討し、ルビ付与方針を定める(ステップS1)。手入力の場合(ステップS3)には、ルビ手入力部による手入力作業に移行するため、以後の作業は実行されない。自動入力が選択されると(ステップS5)定めたルビ付与方針に合致したルビ付与ルールを選択して設定することにより、その設定したルビ付与ルールに対応するルビ付与漢字リストを自動選定する(ステップS7,S9)。
そして、自動ルビ付与部17では、形態素解析して自動的に読み付けを行った字幕用テキストの該当形態素漢字を、ルビ付与漢字リストと照合するとともに、設定したルビ付与ルールに従って自動ルビ付与を実施する(ステップS11)。
<具体例>
次に以下の字幕番組用テキストに対してルビを付す処理例について具体的に説明する。
次に以下の字幕番組用テキストに対してルビを付す処理例について具体的に説明する。
《字幕用テキスト》
「ねえねえ団長団長、時間ですよ時間。
んん、時間?あ失礼しました。えー「くらし探偵団」団長のえなりかずきです。
今回はこの、今私が読んでいた漫画について見てみたいと思います。
まんがと言いましても今回取り上げるのは歴史まん画です。
歴史まん画?それどんなまん画なんですか?えーボクが今読んでいた本は、えー岩手県の歴史を書いた物です。」
「ねえねえ団長団長、時間ですよ時間。
んん、時間?あ失礼しました。えー「くらし探偵団」団長のえなりかずきです。
今回はこの、今私が読んでいた漫画について見てみたいと思います。
まんがと言いましても今回取り上げるのは歴史まん画です。
歴史まん画?それどんなまん画なんですか?えーボクが今読んでいた本は、えー岩手県の歴史を書いた物です。」
図3は、前記字幕用テキストを形態素解析部15によって形態素解析した結果を示しており、原文とその読みを一覧にしたものである。また、図4は、形態素解析の結果から、原文が漢字のものを抽出して漢字原文と読みを一覧にしたものである。
また、図5は、形態素解析における実際的かつ具体的な結果をデータとして示す説明図である。同図において、“S”は文、“SNT”は文の内容、“P”は文節、“Ii”は文節の内容、“/P”は文節の終わり、“M”は形態素を示している。形態素“M”の次に形態素解析の結果としての“読み”が記載されている。
《ルビ付与例の説明》
ルビ付与ルール記憶部11に記憶されたルビ付与ルールは前述した通りである。
ルビ付与ルール記憶部11に記憶されたルビ付与ルールは前述した通りである。
例えば、小学校第三学年向け学校放送番組についてルビつき字幕を制作する場合を例に説明すると、この場合はルビ付与漢字リストには、後述する文部科学省学年別漢字配当表が適用され、下記にように処理される。
図5に示した「漢字原文と読み一覧」における漢字が学年別漢字配当表において、
(1) 第一学年と第二学年分に該当する場合は、ルビは付与しない。
(2) 第三学年分に該当する場合は、「読み」欄のルビを付与する。
(3) それ以外の場合は、漢字を使用せず、「読み」欄のひらがなを使用する。
(4) 複合漢字の場合、一番高い学年の漢字として扱う。
(1) 第一学年と第二学年分に該当する場合は、ルビは付与しない。
(2) 第三学年分に該当する場合は、「読み」欄のルビを付与する。
(3) それ以外の場合は、漢字を使用せず、「読み」欄のひらがなを使用する。
(4) 複合漢字の場合、一番高い学年の漢字として扱う。
このようにして作成されたルビつき字幕に例を図6に示す。(A)、(B)は小学2年生向けのルビつき字幕の一例を示している。“時”、“間”の2つの漢字は、2年生で習う漢字であるため、ルビが付される。“団”は小学5年生で習う漢字のため、ひらがなで記載する。“長”は小学2年で習うが、“団長”の表現については、(A)のように、“だんちょう”、(B)のように、“だん長”と2つ通りの記載方法があり、必要に応じて選択すれば良い。(C)は、小学5年生向けのルビつき字幕の一例を示している。
なお、全漢字についてルビつき字幕を制作する場合は、図4に示した「漢字原文と読み一覧」における漢字部分全てに対し、「読み」欄のひらがなをルビとして付与する処理を行う。その結果は、図6(C)のように表示される。
10 自動ルビ付与装置
11 ルビ付与ルール記憶部
13 ルビ付与漢字リスト記憶部
15 形態素解析部
17 自動ルビ付与部
11 ルビ付与ルール記憶部
13 ルビ付与漢字リスト記憶部
15 形態素解析部
17 自動ルビ付与部
Claims (2)
- ルビの付与ルールを定めたルビ付与ルール記憶部と、
ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部と、
表示対象となる字幕用テキストを形態素解析する形態素解析部と、
この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部から選択されたルビ付与ルールとルビ付与漢字リスト記憶部から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部と、
を備えたことを特徴とする字幕番組データ制作システムにおける自動ルビ付与装置。 - 請求項1に記載の字幕番組データ制作システムにおける自動ルビ付与装置において、
前記ルビ付与漢字リスト記憶部に記憶されるルビ付与漢字リストとしては、常用漢字および表外音訓表や教育漢字表(学年別配当漢字表)、人名漢字表の漢字が含まれることを特徴とする字幕番組データ制作システムにおける自動ルビ付与装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003415240A JP2005176083A (ja) | 2003-12-12 | 2003-12-12 | 字幕番組データ制作システムにおける自動ルビ付与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003415240A JP2005176083A (ja) | 2003-12-12 | 2003-12-12 | 字幕番組データ制作システムにおける自動ルビ付与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005176083A true JP2005176083A (ja) | 2005-06-30 |
Family
ID=34734807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003415240A Pending JP2005176083A (ja) | 2003-12-12 | 2003-12-12 | 字幕番組データ制作システムにおける自動ルビ付与装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005176083A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146143A (ja) * | 2008-12-17 | 2010-07-01 | Fuji Xerox Co Ltd | 文書処理装置及びプログラム |
JP2013225345A (ja) * | 2013-07-31 | 2013-10-31 | Nomura Research Institute Ltd | 約款作成支援装置 |
JPWO2022118720A1 (ja) * | 2020-12-02 | 2022-06-09 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04259060A (ja) * | 1991-02-14 | 1992-09-14 | Fujitsu Ltd | 文書読解支援装置 |
JP2002342311A (ja) * | 2001-05-17 | 2002-11-29 | Telecommunication Advancement Organization Of Japan | 字幕番組制作における表示単位字幕文の自動生成方法 |
-
2003
- 2003-12-12 JP JP2003415240A patent/JP2005176083A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04259060A (ja) * | 1991-02-14 | 1992-09-14 | Fujitsu Ltd | 文書読解支援装置 |
JP2002342311A (ja) * | 2001-05-17 | 2002-11-29 | Telecommunication Advancement Organization Of Japan | 字幕番組制作における表示単位字幕文の自動生成方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010146143A (ja) * | 2008-12-17 | 2010-07-01 | Fuji Xerox Co Ltd | 文書処理装置及びプログラム |
JP2013225345A (ja) * | 2013-07-31 | 2013-10-31 | Nomura Research Institute Ltd | 約款作成支援装置 |
JPWO2022118720A1 (ja) * | 2020-12-02 | 2022-06-09 | ||
WO2022118720A1 (ja) * | 2020-12-02 | 2022-06-09 | 株式会社Adeu.Nek | 画像と文字との混在文章を生成する装置 |
JP7418761B2 (ja) | 2020-12-02 | 2024-01-22 | 株式会社Adeu.Nek | 画像と文字との混在文章を生成する装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2939051C (en) | Instant note capture/presentation apparatus, system and method | |
US20110097693A1 (en) | Aligning chunk translations for language learners | |
Bilaniuk | Purism and pluralism: Language use trends in popular culture in Ukraine since independence | |
KR20090075052A (ko) | 멀티미디어를 이용한 네트워크 영어학습 시스템 | |
CN111739358A (zh) | 一种教学文件的输出方法、装置及电子设备 | |
JP2005176083A (ja) | 字幕番組データ制作システムにおける自動ルビ付与装置 | |
JP2007524128A (ja) | アルファベット発音をコード化するシステム | |
JP2007271817A (ja) | ルビ表示機能付カラオケシステム | |
Baños | Creating credible and natural-sounding dialogue in dubbing: Can it be taught? | |
US11869384B2 (en) | Information processing apparatus, information processing system, and non-transitory computer readable medium | |
JP4768411B2 (ja) | デジタル放送用携帯字幕仕様変換装置とその変換方法 | |
CN111556372A (zh) | 为视音频节目实时添加字幕的方法和装置 | |
Valero-Garcés | Transcription and translation | |
Zhu et al. | The effects of watching subtitled videos on the perception of L2 connected speech by L1 Chinese-L2 English speakers | |
Zhang | The translating of screenplays in the mainland of China | |
JP2004333612A (ja) | ヒントプロフィールを用いた文章タイピング学習システムおよび方法 | |
CN111047924A (zh) | 一种记忆英语单词的视觉化方法及系统 | |
KR102385779B1 (ko) | 콘텐츠에 대한 자막 동기화를 수행하는 전자 장치 및 방법 | |
Juhász-Koch | Linguistic and Cultural Representation in Audiovisual Translation | |
Mehdizadkhani et al. | Translation of graphic codes: The case study of two official Persian dubbed versions | |
Bacon | Defending a Language: The Cantonese Umbrella Movement | |
JP5057764B2 (ja) | 音声合成装置及び音声合成プログラム | |
JP4249585B2 (ja) | 字幕データ作成システム | |
Tidjanl et al. | Subtitling Algerian Colloquialisms in “Chronicle of the Years of Fire | |
JP2023151736A (ja) | 学習用データ作成方法、学習用データ表示方法、学習用データ再生方法、プログラム及び電子機器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060807 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091117 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100406 |