JP2005176083A - 字幕番組データ制作システムにおける自動ルビ付与装置 - Google Patents

字幕番組データ制作システムにおける自動ルビ付与装置 Download PDF

Info

Publication number
JP2005176083A
JP2005176083A JP2003415240A JP2003415240A JP2005176083A JP 2005176083 A JP2005176083 A JP 2005176083A JP 2003415240 A JP2003415240 A JP 2003415240A JP 2003415240 A JP2003415240 A JP 2003415240A JP 2005176083 A JP2005176083 A JP 2005176083A
Authority
JP
Japan
Prior art keywords
ruby
kanji
reading
automatic
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003415240A
Other languages
English (en)
Inventor
Eiji Sawamura
英治 沢村
Takao Monma
隆雄 門馬
Kenji Ozeki
健二 大関
Toru Tsugi
徹 都木
Katsuhiko Shirai
克彦 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
National Institute of Information and Communications Technology
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
NEC Corp
Nippon Hoso Kyokai NHK
National Institute of Information and Communications Technology
NHK Engineering Services Inc
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Hoso Kyokai NHK, National Institute of Information and Communications Technology, NHK Engineering Services Inc, Japan Broadcasting Corp filed Critical NEC Corp
Priority to JP2003415240A priority Critical patent/JP2005176083A/ja
Publication of JP2005176083A publication Critical patent/JP2005176083A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Studio Circuits (AREA)
  • Studio Devices (AREA)

Abstract

【課題】 簡単な操作によって所望の漢字にルビを自動付与することを可能にする。
【解決手段】 ルビの付与ルールを定めたルビ付与ルール記憶部11と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部13と、表示対象となる字幕用テキストを形態素解析する形態素解析部15と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部11から選択されたルビ付与ルールとルビ付与漢字リスト記憶部13から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部17とを備える。
【選択図】 図1

Description

本発明は、字幕番組データ中の漢字にルビを自動付与する自動ルビ付与装置に関する。
[発明の概要]
本発明は、字幕番組データ制作におけるルビ付与作業の改善に関するものであり、特にルビを付与すべき漢字の複数リストであるルビ付与漢字リストと、ルビの種々の付与法を定めたルビ付与ルールとを備え、形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて選択したルビ付与ルールのルビ付与法とそのルビ付与漢字リストによって、該当する漢字にルビを自動付与するものである。
対象素材番組に応じた適切なルビ付与ルールの選択とそのルールによるルビの自動付与により、ルビ付与作業を大幅に改善できるので、字幕番組制作の時間短縮、労力軽減に大きく寄与する。
字幕付きテレビ番組放送を受信者が利用する際、字幕が読み易く、理解し易いものであることが重要である。したがって、字幕番組制作における字幕原稿作成では、熟練した人手を使い、多大な労力と時間を掛けて、読み易くて理解し易い字幕を制作している。
しかしながら、今後適用番組の分野や番組数などの拡大が求められる字幕放送において、この熟練した人手、多大な労力と時間を要するこのような形態の字幕番組制作手法は、字幕番組制作上の大きなネックとなっている。
現在最も多く行われている字幕番組制作形態では、タイムコードを映像にスーパーした番組映像と番組音声などを素材とし、これを放送関係経験者など専門知識のある人によって、番組アナウンスの要約書起し(処理1)、次いで字幕表示イメージ化(処理2;この処理は所定の字幕原稿作成要領に基づく)、およびその開始・終了タイムコード記録(処理3)の各作業を行い、字幕データを作成している。この字幕データを担当の字幕制作責任者、原稿作成者、オペレータなどの立ち会いのもとで、試写・校正を行って完成字幕としている。
上述した処理1〜処理3の作業の中でより多くの時間を必要とするのは、処理1の番組スピーチの書起し作業であり、この作業では、番組スピーチを聴取して字幕原稿を作成するという点において最も人間の知能に負うところが多い。
特開2002−351490
ところで、番組スピーチの書起し作業の一貫としてカナ漢字混じりテキストの内、必要な漢字にルビを付与する作業がある。
従来の人手によるルビ付与作業について以下に説明する。
例えば、“聴覚障害者の方々にもテレビを健聴者と同じように楽しむ”という観点から番組の利用者層を想定して字幕にルビを付すことを考えた場合、字幕番組制作システムの画面上において、図7(A)に示すように、 先ず、ルビを入れたい漢字を指定する。図の例では、“健聴者”が指定されている。次いで、図8に示すように、画面上に文字(読み)を入力する。この場合には、“けんちょうしゃ”と入力する。
次に、図7(B)に示すように、ルビを入れるためにの空間を確保するために上下方向に1行(半角分)ずらす。また、入力した文字のサイズを縦横各1/2(=1/4角)にしたフォントを設定する。
最後に、ルビを入れたい該当する漢字の上に入力したルビを置く。このようにして、図7(B)に示すような手入力されたルビつき字幕が作成・表示される。
しかしながら、上述したように、字幕番組データ中の漢字にルビを付与する作業は、人間の手作業で行われており、全ての字幕データに対して前述したような手作業をするのは、作業者にとっては多大の労力と時間および能力を要することとなり、字幕番組の制作時間や労力を低減するために、その改善が急がれている。
本発明は、上記事情に鑑みてなされたものであり、簡単な操作によって所望の漢字にルビを自動付与することができる字幕番組データ制作システムにおける自動ルビ付与装置を提供することを目的としている。
上記の目的を達成するために請求項1の発明は、ルビの付与ルールを定めたルビ付与ルール記憶部と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部と、表示対象となる字幕用テキストを形態素解析する形態素解析部と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部から選択されたルビ付与ルールとルビ付与漢字リスト記憶部から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部とを備えたことを特徴としている。
請求項2の発明では、請求項1に記載の字幕番組データ制作システムにおける自動ルビ付与装置において、前記ルビ付与漢字リスト記憶部に記憶されるルビ付与漢字リストとしては、常用漢字および表外音訓表や教育漢字表(学年別配当漢字表)、人名漢字表の漢字が含まれることを特徴としている。
本発明によれば、作業者が手入力することなく、簡単な操作によって所望の漢字にルビを自動付与することができ、作業者の労力、時間、能力の大幅な低減に寄与することが可能となる。
本発明は、字幕番組データ制作におけるルビ付与作業の労力・時間を軽減するものであり、特にルビを付与すべき漢字リストであるルビ付与漢字リストと、ルビの種々の付与法を定めたルビ付与ルールとを備え、対象素材番組の分野などに応じて選択したルビ付与法のルビ付与ルールとそのルビ付与漢字リストによって、該当する漢字にルビを自動付与するものである。
その結果、対象素材番組に応じた適切なルビ付与ルールの選択とそのルールによるルビの自動付与により、ルビ付与作業を大幅に改善でき、字幕番組制作の時間の短縮、労力軽減などに大きく寄与する。
<実施例>
本発明に係る字幕番組データ制作システムにおける自動ルビ付与装置の一実施例を図面に基づいて説明する。図1は、字幕番組データ制作システムにおける自動ルビ付与装置の構成を示している。
同図に示す自動ルビ付与装置10は、コンピュータのソフトウェアで構成することができ、その機能上、ルビの付与ルールを定めたルビ付与ルール記憶部11と、ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部13と、表示対象となる字幕用テキストを形態素解析する形態素解析部15と、この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部11から選択されたルビ付与ルールとルビ付与漢字リスト記憶部13から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部17とを備えている。
ルビ付与ルール記憶部11には、ルビの種々の付与法を定めたルビ付与ルールが記憶されている。字幕制作事業者などでは、一般に字幕番組制作要領などを設けており、実際の字幕データ作成作業におけるルビ付与に際し、その要領などに示される基準に沿って行われている。記憶されるルビ付与ルールの一例を以下に示す。
(1) 常用漢字以外の漢字には全てルビを付与する。
(2) 常用漢字であっても、表外音訓の場合はルビを付与する。
(3) 学校放送番組などでは、教育漢字表(学年別配当漢字表)を優先適用し、ルビを付与する。
(4) ルビを付与すべき漢字であっても、所定時間(所定回数)内に出現する同一漢字については初回のみルビを付与する。
(5) NHK編「新用字用語辞典」で認めている漢字はルビ不要とする。
(6) 都道府県、制令指定都市名にはルビ不要とする。
(7) 人名漢字は常用漢字でないので、ルビを付与する。
(8) 漢字にはすべてルビを付与しない。
また、ルビ付与漢字リスト記憶部13には、例えば、ルビを付与すべき漢字の複数リストである以下のようなルビ付与漢字リストが記憶されている。
(1) 常用漢字
(2) 表外音訓表
(3) 教育漢字表(学年別配当漢字表)
(4) NHK編「新用字用語辞典」
(5) 人名漢字表
(6) その他、特定の漢字リスト
形態素解析部15は、漢字かな交じり文で表記されている入力された字幕用テキストを対象として、形態素毎に分割する分割機能と、分割機能を発揮することで分割された各形態素毎に、表現形、品詞、読み、標準表現などの付加情報を付与する付加情報付与機能を備えている。
自動ルビ付与部17は、外部からルビ付与指令が供給された場合に、対象素材番組が教育番組か娯楽番組か等、教育番組であれば何年生向けか等その分野などに応じて、ルビ付与ルール記憶部11からルビ付与ルールを選択すると共に、ルビ付与漢字リスト記憶部13から該当するルビ付与漢字リストを選択し、形態素解析部15によって形態素解析されて得られた読み付け情報を基にして字幕用テキスト中の該当する漢字にルビを自動付与する。
本発明によるルビ自動付与の処理手順を図2に基づいて説明する。
先ず、字幕制作担当者が当該番組素材を検討し、ルビ付与方針を定める(ステップS1)。手入力の場合(ステップS3)には、ルビ手入力部による手入力作業に移行するため、以後の作業は実行されない。自動入力が選択されると(ステップS5)定めたルビ付与方針に合致したルビ付与ルールを選択して設定することにより、その設定したルビ付与ルールに対応するルビ付与漢字リストを自動選定する(ステップS7,S9)。
そして、自動ルビ付与部17では、形態素解析して自動的に読み付けを行った字幕用テキストの該当形態素漢字を、ルビ付与漢字リストと照合するとともに、設定したルビ付与ルールに従って自動ルビ付与を実施する(ステップS11)。
<具体例>
次に以下の字幕番組用テキストに対してルビを付す処理例について具体的に説明する。
《字幕用テキスト》
「ねえねえ団長団長、時間ですよ時間。
んん、時間?あ失礼しました。えー「くらし探偵団」団長のえなりかずきです。
今回はこの、今私が読んでいた漫画について見てみたいと思います。
まんがと言いましても今回取り上げるのは歴史まん画です。
歴史まん画?それどんなまん画なんですか?えーボクが今読んでいた本は、えー岩手県の歴史を書いた物です。」
図3は、前記字幕用テキストを形態素解析部15によって形態素解析した結果を示しており、原文とその読みを一覧にしたものである。また、図4は、形態素解析の結果から、原文が漢字のものを抽出して漢字原文と読みを一覧にしたものである。
また、図5は、形態素解析における実際的かつ具体的な結果をデータとして示す説明図である。同図において、“S”は文、“SNT”は文の内容、“P”は文節、“Ii”は文節の内容、“/P”は文節の終わり、“M”は形態素を示している。形態素“M”の次に形態素解析の結果としての“読み”が記載されている。
《ルビ付与例の説明》
ルビ付与ルール記憶部11に記憶されたルビ付与ルールは前述した通りである。
例えば、小学校第三学年向け学校放送番組についてルビつき字幕を制作する場合を例に説明すると、この場合はルビ付与漢字リストには、後述する文部科学省学年別漢字配当表が適用され、下記にように処理される。
図5に示した「漢字原文と読み一覧」における漢字が学年別漢字配当表において、
(1) 第一学年と第二学年分に該当する場合は、ルビは付与しない。
(2) 第三学年分に該当する場合は、「読み」欄のルビを付与する。
(3) それ以外の場合は、漢字を使用せず、「読み」欄のひらがなを使用する。
(4) 複合漢字の場合、一番高い学年の漢字として扱う。
このようにして作成されたルビつき字幕に例を図6に示す。(A)、(B)は小学2年生向けのルビつき字幕の一例を示している。“時”、“間”の2つの漢字は、2年生で習う漢字であるため、ルビが付される。“団”は小学5年生で習う漢字のため、ひらがなで記載する。“長”は小学2年で習うが、“団長”の表現については、(A)のように、“だんちょう”、(B)のように、“だん長”と2つ通りの記載方法があり、必要に応じて選択すれば良い。(C)は、小学5年生向けのルビつき字幕の一例を示している。
なお、全漢字についてルビつき字幕を制作する場合は、図4に示した「漢字原文と読み一覧」における漢字部分全てに対し、「読み」欄のひらがなをルビとして付与する処理を行う。その結果は、図6(C)のように表示される。
本発明に係る字幕番組データ制作システムにおける自動ルビ付与装置の一実施例の構成を示すブロック図。 本発明に係る字幕番組データ制作システムにおける自動ルビ付与装置の一実施例の処理手順を示すフローチャート。 形態素解析の結果である「原文と読み一覧」を示す説明図。 形態素解析の結果である「漢字原文と読み一覧」を示す説明図。 形態素解析の結果であるデータの一例を示す説明図。 自動ルビ付与装置によって作成されたルビつき字幕の一例を示す説明図。 従来の手入力により作成されるルビつき字幕の処理手順を示す説明図。 従来の手入力により作成されるルビつき字幕の処理手順を示す説明図。
符号の説明
10 自動ルビ付与装置
11 ルビ付与ルール記憶部
13 ルビ付与漢字リスト記憶部
15 形態素解析部
17 自動ルビ付与部

Claims (2)

  1. ルビの付与ルールを定めたルビ付与ルール記憶部と、
    ルビを付与すべき漢字の複数リストを記憶したルビ付与漢字リスト記憶部と、
    表示対象となる字幕用テキストを形態素解析する形態素解析部と、
    この形態素解析によって得られる読み付け情報を基に、対象素材番組の分野などに応じて前記ルビ付与ルール記憶部から選択されたルビ付与ルールとルビ付与漢字リスト記憶部から選択されたルビ付与漢字リストによって字幕用テキスト中の該当する漢字にルビを自動付与する自動ルビ付与部と、
    を備えたことを特徴とする字幕番組データ制作システムにおける自動ルビ付与装置。
  2. 請求項1に記載の字幕番組データ制作システムにおける自動ルビ付与装置において、
    前記ルビ付与漢字リスト記憶部に記憶されるルビ付与漢字リストとしては、常用漢字および表外音訓表や教育漢字表(学年別配当漢字表)、人名漢字表の漢字が含まれることを特徴とする字幕番組データ制作システムにおける自動ルビ付与装置。
JP2003415240A 2003-12-12 2003-12-12 字幕番組データ制作システムにおける自動ルビ付与装置 Pending JP2005176083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003415240A JP2005176083A (ja) 2003-12-12 2003-12-12 字幕番組データ制作システムにおける自動ルビ付与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003415240A JP2005176083A (ja) 2003-12-12 2003-12-12 字幕番組データ制作システムにおける自動ルビ付与装置

Publications (1)

Publication Number Publication Date
JP2005176083A true JP2005176083A (ja) 2005-06-30

Family

ID=34734807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003415240A Pending JP2005176083A (ja) 2003-12-12 2003-12-12 字幕番組データ制作システムにおける自動ルビ付与装置

Country Status (1)

Country Link
JP (1) JP2005176083A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146143A (ja) * 2008-12-17 2010-07-01 Fuji Xerox Co Ltd 文書処理装置及びプログラム
JP2013225345A (ja) * 2013-07-31 2013-10-31 Nomura Research Institute Ltd 約款作成支援装置
JPWO2022118720A1 (ja) * 2020-12-02 2022-06-09

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04259060A (ja) * 1991-02-14 1992-09-14 Fujitsu Ltd 文書読解支援装置
JP2002342311A (ja) * 2001-05-17 2002-11-29 Telecommunication Advancement Organization Of Japan 字幕番組制作における表示単位字幕文の自動生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04259060A (ja) * 1991-02-14 1992-09-14 Fujitsu Ltd 文書読解支援装置
JP2002342311A (ja) * 2001-05-17 2002-11-29 Telecommunication Advancement Organization Of Japan 字幕番組制作における表示単位字幕文の自動生成方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146143A (ja) * 2008-12-17 2010-07-01 Fuji Xerox Co Ltd 文書処理装置及びプログラム
JP2013225345A (ja) * 2013-07-31 2013-10-31 Nomura Research Institute Ltd 約款作成支援装置
JPWO2022118720A1 (ja) * 2020-12-02 2022-06-09
WO2022118720A1 (ja) * 2020-12-02 2022-06-09 株式会社Adeu.Nek 画像と文字との混在文章を生成する装置
JP7418761B2 (ja) 2020-12-02 2024-01-22 株式会社Adeu.Nek 画像と文字との混在文章を生成する装置

Similar Documents

Publication Publication Date Title
CA2939051C (en) Instant note capture/presentation apparatus, system and method
US20110097693A1 (en) Aligning chunk translations for language learners
Bilaniuk Purism and pluralism: Language use trends in popular culture in Ukraine since independence
KR20090075052A (ko) 멀티미디어를 이용한 네트워크 영어학습 시스템
CN111739358A (zh) 一种教学文件的输出方法、装置及电子设备
JP2005176083A (ja) 字幕番組データ制作システムにおける自動ルビ付与装置
JP2007524128A (ja) アルファベット発音をコード化するシステム
JP2007271817A (ja) ルビ表示機能付カラオケシステム
Baños Creating credible and natural-sounding dialogue in dubbing: Can it be taught?
US11869384B2 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium
JP4768411B2 (ja) デジタル放送用携帯字幕仕様変換装置とその変換方法
CN111556372A (zh) 为视音频节目实时添加字幕的方法和装置
Valero-Garcés Transcription and translation
Zhu et al. The effects of watching subtitled videos on the perception of L2 connected speech by L1 Chinese-L2 English speakers
Zhang The translating of screenplays in the mainland of China
JP2004333612A (ja) ヒントプロフィールを用いた文章タイピング学習システムおよび方法
CN111047924A (zh) 一种记忆英语单词的视觉化方法及系统
KR102385779B1 (ko) 콘텐츠에 대한 자막 동기화를 수행하는 전자 장치 및 방법
Juhász-Koch Linguistic and Cultural Representation in Audiovisual Translation
Mehdizadkhani et al. Translation of graphic codes: The case study of two official Persian dubbed versions
Bacon Defending a Language: The Cantonese Umbrella Movement
JP5057764B2 (ja) 音声合成装置及び音声合成プログラム
JP4249585B2 (ja) 字幕データ作成システム
Tidjanl et al. Subtitling Algerian Colloquialisms in “Chronicle of the Years of Fire
JP2023151736A (ja) 学習用データ作成方法、学習用データ表示方法、学習用データ再生方法、プログラム及び電子機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091117

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406