JPH10308887A - Program transmitter - Google Patents

Program transmitter

Info

Publication number
JPH10308887A
JPH10308887A JP9116758A JP11675897A JPH10308887A JP H10308887 A JPH10308887 A JP H10308887A JP 9116758 A JP9116758 A JP 9116758A JP 11675897 A JP11675897 A JP 11675897A JP H10308887 A JPH10308887 A JP H10308887A
Authority
JP
Japan
Prior art keywords
program
reading
charge
voice
manuscript
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9116758A
Other languages
Japanese (ja)
Inventor
Kazuyuki Honda
和幸 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9116758A priority Critical patent/JPH10308887A/en
Publication of JPH10308887A publication Critical patent/JPH10308887A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a program transmitter by which real time checking of recited contents of an announcer and time progress management at a program transmission, and accuracy is improved by speech recognition as to a plurality of reading persons in charge. SOLUTION: A program transmitter A that generates a program original and transmits a program is provided with; a storage means M4 that stores a voice parameter of each person in charge for reciting; a KANA (Japanese syllabary of round form) file F2 for reciting of an original; a storage means M3 for information concerning persons in charge for reciting; a means 7 that uses a voice parameter selected based on information concerning persons in charge for reciting so as to recognize the voice of the persons in charge for reciting; and a comparison means M5 that discriminates coincidence between the speech recognition content of the persons in charge for reciting and contents of the KANA file F2.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、放送局における番
組送出装置に関し、とりわけニュース番組に代表される
ような、話者の喋りがある番組の送出装置に関するもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a program transmitting apparatus in a broadcasting station, and more particularly to a program transmitting apparatus typified by a news program in which speakers speak.

【0002】[0002]

【従来の技術】従来、番組とりわけニュース番組では、
ニュース原稿を作成し、この原稿に基づき放送を行って
いる。この場合、原稿により、ニュース単位での時間に
合うかの読み合わせが為され、さらに表現のチェックが
為されている。また、これらの原稿入力の情報化が進
み、原稿の作成をワードプロセッサやパソコンにより行
うことが多くなっている。
2. Description of the Related Art Conventionally, in programs, especially news programs,
News manuscripts are created and broadcast based on these manuscripts. In this case, the original is read to see if it matches the time in news units, and the expression is checked. In addition, computerization of the input of these originals is progressing, and the originals are often created by a word processor or a personal computer.

【0003】[0003]

【発明が解決しようとする課題】このような、ニュース
番組等で話者であるアナウンサーが原稿を読み上げて喋
る場合、読み間違い等が発生することがある。従来技術
によれば、音声認識により原稿を読むアナウンサーの声
を認識し、それが原稿と一致しているか否かを自動的に
検出することが可能となっているものの、これら原稿の
文章は漢字混じり文であるため、原稿中の漢字をひらが
な等と母音子音のように音声認識で利用できる形態に変
換する必要がある。
When an announcer who is a speaker reads a manuscript in a news program or the like and speaks, a reading error or the like may occur. According to the prior art, it is possible to recognize the voice of an announcer reading a manuscript by voice recognition and automatically detect whether or not it matches the manuscript, but the text of these manuscripts is kanji Since it is a mixed sentence, it is necessary to convert the kanji in the manuscript into a form that can be used for speech recognition, such as hiragana and vowel consonants.

【0004】ところで、原稿中には人名のように読み方
を一意には決めにくかったり、あるいは時事ニュースに
おけるように地方の地名や政党名、あるいは使用頻度が
少ない技術用語といった、馴染みの薄い固有名詞や熟語
あるいは新しい言葉がしばしば発生する。これら用語は
原稿の作成時に辞書等で確認がなされているものである
が、アナウンサーが原稿を読み上げて喋る場合に、これ
らを音声認識するためには再度、漢字をひらがな等に変
換する作業が必要になり、このように類似の作業が繰り
返し行われるため無駄が生じて非効率であった。更にま
た、音声認識系にそのための辞書を内蔵させる必要があ
った。
[0004] By the way, in the manuscript, it is difficult to determine how to read uniquely like a person's name, or as a familiar noun such as a local place name or a political party name as in current affairs news, or a technical term that is rarely used. Phrases or new words often occur. These terms are checked in a dictionary or the like when the manuscript is created, but when the announcer reads and speaks the manuscript, it is necessary to convert the kanji to hiragana again to recognize them. Thus, the similar work is repeatedly performed, thus causing waste and inefficiency. Furthermore, it was necessary to incorporate a dictionary for the speech recognition system.

【0005】また、放送はあらかじめ決められた時間枠
内で番組を編成するのが一般的である。とりわけニュー
ス番組では生放送となるため、所定の時間内に過不足な
く収めるべく、時間進行管理が為される必要がある。そ
のため、アナウンサーの原稿読み上げのスピードが予定
の速度と一致、あるいは許容される速度範囲内にあるか
否かの監視が為されるが、従来はこれを人手によって行
っていることが多く、このため効率的でないと行った問
題があった。
[0005] Broadcasting generally organizes programs within a predetermined time frame. In particular, since a news program is a live broadcast, it is necessary to manage time progress in order to keep the time within a predetermined time. Therefore, it is monitored whether or not the announcer's reading speed of the original matches the expected speed or is within the allowable speed range. There was a problem that I went to if it was not efficient.

【0006】本発明は、前記のような従来技術における
問題点を解決するためなされたもので、番組送出時にお
いてアナウンサーの読み上げ内容の実時間検査を可能と
し、かつ時間進行管理を容易にし、さらに複数の読み上
げ担当者について音声認識により精度向上を可能にする
番組送出装置を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems in the prior art, and enables a real-time inspection of the content read out by an announcer at the time of transmitting a program, and facilitates time progress management. It is an object of the present invention to provide a program transmission device that can improve the accuracy of a plurality of reading staff by voice recognition.

【0007】[0007]

【課題を解決するための手段】前記従来技術の課題を解
決するため、本発明は、ニュース原稿の作成入力の際
に、原稿とともに対応するかな文字もファイルとして記
憶し、実際の放送時においてはアナウンサーの原稿の読
みが原稿と一致するかを、かな文字ファイルを用いて判
別し、実時間検査をする。すなわち、アナウンサーに供
される読み上げ原稿に対し、かな文字ファイルを用意
し、アナウンサーに応じた音声パラメータで喋りの用語
のチェックを行うものである。
In order to solve the above-mentioned problems in the prior art, the present invention stores a kana character as a file together with a manuscript when a news manuscript is created and inputted. Whether the reading of the manuscript of the announcer matches the manuscript is determined using a kana character file, and a real-time inspection is performed. That is, a kana character file is prepared for a read-out manuscript to be provided to an announcer, and a spoken term is checked using voice parameters corresponding to the announcer.

【0008】また、予定していた原稿の読み上げスピー
ドと実際の読み上げが一致しているかを監視し、その誤
差の程度を表示する。すなわち、日本語の”や”、”
で”等のあとに生じる無音状態を検出して、読み上げ速
度が適当であるか否かのチェックを行うものである。
Further, it monitors whether or not the read speed of the original document and the actual read speed match, and displays the degree of the error. That is, the Japanese “ya”, “”
In this case, a silent state occurring after "" is detected to check whether or not the reading speed is appropriate.

【0009】さらに、予定されているアナウンサーの担
当者名を記憶しておき、音声認識の際はアナウンサーご
との音声パラメータを設定し、音声認識の精度を向上さ
せる。これは、いわゆる特定話者での音声認識により認
識精度が向上することを利用するものである。
Further, the name of the person in charge of the scheduled announcer is stored, and at the time of voice recognition, voice parameters are set for each announcer to improve the accuracy of voice recognition. This utilizes the fact that recognition accuracy is improved by so-called voice recognition by a specific speaker.

【0010】以下、本発明に係る手段を述べる。本発明
の請求項1に係る番組送出装置は、番組用の原稿を作成
し、番組を送出する番組送出装置において、読み上げを
行う各担当者の音声パラメータを記憶する記憶手段と、
原稿に対する読み上げ用のかな文字ファイルと、読み上
げを行う担当者情報の記憶手段と、前記読み上げを行う
担当者情報に基づいて選択される音声パラメータを用い
て、読み上げを行う担当者の音声を認識する手段と、前
記かな文字ファイルの内容と、読み上げ担当者の音声認
識内容との一致判別を行う比較手段とを具備することを
特徴とする。
Hereinafter, the means according to the present invention will be described. A program sending device according to claim 1 of the present invention is a program sending device that creates a program manuscript and sends the program, and stores a voice parameter of each person who reads aloud,
Recognizing the voice of the person in charge of reading using a kana character file for reading a document, storage means for the information of the person in charge of reading, and voice parameters selected based on the information of the person in charge of reading. Means for comparing the contents of the kana character file with the voice recognition contents of the person in charge of reading out.

【0011】前記の構成によれば、特殊用語とかな文字
との変換作業の重複が排除され、よってニュース等の原
稿の読み上げ内容と原稿との一致判別が効率化されると
ともに、原稿の読み違いや、不適切な用語の使用の監視
が自動的になされる。更に、音声認識の認識精度の向上
により、各話者毎の判別精度が向上し、よって誤差の少
ない判別が為される。
According to the above configuration, the duplication of the conversion work between the special term and the kana character is eliminated, so that the discrimination between the read content of the manuscript such as news and the manuscript is made more efficient, and the misreading of the manuscript is performed. And monitoring for inappropriate terminology is automatically done. Further, by improving the recognition accuracy of speech recognition, the accuracy of determination for each speaker is improved, and thus, determination with less error is performed.

【0012】本発明の請求項2に係る番組送出装置は、
請求項1記載の番組送出装置において、前記かな文字フ
ァイルの部分における読み上げの際の時間長の演算手段
と、句点等の無音状態の判別手段を有し、前記の一致判
別を行う比較手段で前記演算手段により設定した時間長
に対し口頭での喋りの進行状況を判別することを特徴と
する。
According to a second aspect of the present invention, there is provided a program transmitting apparatus comprising:
2. The program transmitting apparatus according to claim 1, further comprising: means for calculating a time length at the time of reading out the kana character file portion; and means for determining a silent state such as a period, and said comparing means for performing the match determination. It is characterized in that the progress of the verbal speech is determined for the time length set by the calculating means.

【0013】前記の構成によれば、原稿の読み上げスピ
ードと実際の読み上げが一致しているかの監視が自動的
に実行される。これによって、原稿の読み違いや不適切
な用語の使用の監視が自動的に行われ、よって番組進行
の迅速かつ高精度な時間管理がなされる。
According to the above configuration, monitoring whether the reading speed of the document matches the actual reading is automatically executed. As a result, misreading of the original and use of inappropriate terms are automatically monitored, so that the program progress can be quickly and accurately managed.

【0014】本発明の請求項3に係る番組送出装置は、
請求項1または2記載の番組送出装置において、単語の
記憶手段と口頭で喋る内容との比較手段を有し、記憶手
段内の単語が発生した場合、その旨を表示することを特
徴とする。
According to a third aspect of the present invention, there is provided a program transmitting apparatus comprising:
3. The program transmitting apparatus according to claim 1, further comprising a word storage unit and a unit for comparing the content spoken orally, and when a word in the storage unit occurs, the fact is displayed.

【0015】前記の構成によれば、実時間中に発生する
不規則発音が、判別時において効果的に除去される。
According to the above arrangement, irregular sounds generated during real time are effectively removed at the time of discrimination.

【0016】[0016]

【発明の実施の形態】以下、この発明の好適な実施形態
を添付図を参照して詳細に説明する。なお、以下に述べ
る実施形態は、この発明の好適な具現例の一部であり、
技術構成上好ましい種々の限定が付されているが、この
発明の範囲は、以下の説明において特にこの発明を限定
する旨の記載がない限り、これらの形態に限られるもの
ではない。
Preferred embodiments of the present invention will be described below in detail with reference to the accompanying drawings. The embodiment described below is a part of a preferred embodiment of the present invention,
Although various limitations that are preferable in terms of the technical configuration are given, the scope of the present invention is not limited to these embodiments unless otherwise specified in the following description.

【0017】図1は、本発明に係る番組送出装置の一実
施形態における、要部のブロック構成図である。同図
で、符号F1は漢字混じりの原稿ファイル、符号F2
は、かな文字ファイル、符号M1は制御手段、符号M2
はかな文字ファイル編成手段、符号M3は担当者情報記
憶手段、符号M4は音声パラメータ記憶手段、符号M5
は一致判別のための比較手段、符号M6は所要時間演算
手段、符号M7は計時手段、符号M8は無音状態判別手
段、符号M9は読み上げ速度比較手段、符号M10は単
語記憶手段である。
FIG. 1 is a block diagram showing a main part of an embodiment of a program transmitting apparatus according to the present invention. In the figure, reference numeral F1 denotes a manuscript file containing kanji, and reference numeral F2.
Is a kana character file, code M1 is control means, code M2
Hana character file organization means, code M3 is person information storage means, code M4 is voice parameter storage means, code M5
Is a comparing means for determining a coincidence, M6 is a required time calculating means, M7 is a time measuring means, M8 is a silent state determining means, M9 is a reading speed comparing means, and M10 is a word storage means.

【0018】原稿ファイル(漢字混じり)F1、かな文
字ファイルF2は、ハードディスク等の大容量記録媒体
上に形成される。さらに、担当者情報記憶手段M3、音
声パラメータ記憶手段M4、単語記憶手段M10も、ハ
ードディスクあるいは不揮発性メモリ装置(例えばSR
AMやフラッシュメモリ等)に格納される。
The original file (mixed with Chinese characters) F1 and the kana character file F2 are formed on a large-capacity recording medium such as a hard disk. Further, the person in charge information storage unit M3, the voice parameter storage unit M4, and the word storage unit M10 are also provided with a hard disk or a non-volatile memory device (for example, SR
AM, flash memory, etc.).

【0019】一方、制御手段M1、かな文字ファイル編
成手段M2、一致判別のための比較手段M5、所要時間
演算手段M6、計時手段M7、無音状態判別手段M8、
読み上げ速度比較手段M9はそれぞれ、CPU1(後述
する図2参照)によって実行可能なプログラム形式で例
えばROM等に格納されており、必要に応じてCPU1
により実行される。
On the other hand, control means M1, kana character file organizing means M2, comparing means M5 for matching determination, required time calculating means M6, clocking means M7, silent state determining means M8,
Each of the reading speed comparison means M9 is stored in, for example, a ROM or the like in the form of a program executable by the CPU 1 (see FIG. 2 described later).
Is executed by

【0020】さらに符号40はマイクロフォン、符号4
5はキーボード、符号2は出力/表示装置である。出力
/表示装置2は、CRTやLCDによるモニター装置あ
るいは、プリンタ装置によって構成される。
Reference numeral 40 denotes a microphone, and reference numeral 4 denotes a microphone.
5 is a keyboard, 2 is an output / display device. The output / display device 2 is configured by a monitor device such as a CRT or an LCD, or a printer device.

【0021】キーボード45から担当するアナウンサー
の情報が入力される。この場合、二通りの情報がある。
第一種類の情報は、蓄積される担当者情報の更新・追加
であり、この第一の情報が入力されると、担当者情報記
憶手段M3が実行され、該当する担当者固有の音声パラ
メータ(および関連データ)が音声パラメータ記憶手段
M4に記憶される。この場合、旧いデータは更新される
ことになる。
The information of the announcer in charge is input from the keyboard 45. In this case, there are two types of information.
The first type of information is the update / addition of the person-in-charge information to be stored. When this first information is input, the person-in-charge information storage means M3 is executed and the corresponding person-specific voice parameter ( And related data) are stored in the voice parameter storage means M4. In this case, the old data will be updated.

【0022】第二種類の情報は、放送時に担当するアナ
ウンサー名を特定するものであり、この情報が入力され
ると、制御手段M1は音声パラメータ記憶手段M4に記
憶された音声パラメータデータから、該当する担当者の
データを取り出して音声認識装置(音声認識ボード)7
に入力する。これによって音声認識装置(音声認識ボー
ド)7は、このアナウンサーを特定話者とするパラメー
タ設定を行う。これにより、音声認識装置7はこのアナ
ウンサーの音声を精度よく認識することが可能になる。
The second type of information specifies the name of the announcer in charge at the time of broadcasting, and when this information is input, the control means M1 determines the corresponding announcer from the voice parameter data stored in the voice parameter storage means M4. The data of the person in charge is taken out and a voice recognition device (voice recognition board) 7
To enter. As a result, the speech recognition device (speech recognition board) 7 performs parameter setting with the announcer as the specific speaker. Thereby, the voice recognition device 7 can accurately recognize the voice of the announcer.

【0023】ついで、キーボード45から原稿が入力さ
れると、原稿ファイル(漢字混じり)F1が作成される
と同時に、かな文字ファイル編成手段M2によってかな
文字ファイルF2が作成される。前記のようにして、放
送のための準備が整う。
Next, when an original is input from the keyboard 45, an original file (mixed with Chinese characters) F1 is created, and at the same time, a kana character file F2 is created by the kana character file organizing means M2. As described above, the preparation for broadcasting is completed.

【0024】放送が開始され、アナウンサーが原稿の読
み上げを開始すると、アナウンサーの音声はマイクロフ
ォン40を経て音声認識装置(音声認識ボード)7に入
力され、音声認識がなされる。音声認識の結果は、一致
判別のための比較手段M5に入力される。
When the broadcaster starts and the announcer starts reading out the original, the voice of the announcer is input to the voice recognition device (voice recognition board) 7 via the microphone 40, and voice recognition is performed. The result of the voice recognition is input to the comparing means M5 for matching determination.

【0025】制御手段M1が、かな文字ファイルF2か
ら該当するかな文字列を抽出して比較手段M5に入力す
ると、比較手段M5は入力された前記音声認識の結果
と、このかな文字列とが一致するか否かを比較によって
判別し、判別結果を出力/表示装置2に送り、出力/表
示させる。誤った読み上げであれば、誤り発生表示を見
てアナウンサーが直ちに訂正等で対処することができ
る。
When the control means M1 extracts a corresponding kana character string from the kana character file F2 and inputs the character string to the comparing means M5, the comparing means M5 matches the input speech recognition result with the kana character string. Whether or not to perform the determination is determined by comparison, and the determination result is sent to the output / display device 2 for output / display. In the case of erroneous reading, the announcer can immediately deal with the error occurrence display with correction or the like.

【0026】ここで、音声認識の結果と、かな文字列と
が一致しない部分があると、比較手段M5はこの不一致
部分が、単語記憶手段M10に記憶されている、例え
ば’エー’、’アー、’’オー’といった間投詞に一致
すれば、誤りではないものの、不規則音声として表示
し、アナウンサーに注意を喚起することができる。これ
により、アナウンサーはさらに質の高いアナウンスを心
掛けることができる。
If there is a part where the result of the speech recognition does not match the kana character string, the comparing means M5 stores the mismatched part in the word storage means M10, for example, "A", "A". If it matches an interjection such as, '' O '', it is displayed as irregular voice, though it is not an error, and the announcer can be alerted. In this way, the announcer can keep an even higher quality announcement.

【0027】一方、制御手段M1は、前記の抽出したか
な文字列を、所要時間演算手段M6にも入力する。所要
時間演算手段M6は、該かな文字列の読み上げ所要時間
を演算して、読み上げ速度比較手段M9に送る。
On the other hand, the control means M1 also inputs the extracted kana character string to the required time calculation means M6. The required time calculating means M6 calculates the required reading time of the kana character string and sends it to the reading speed comparing means M9.

【0028】また一方、無音状態判別手段M8は、マイ
クロフォン40からの音声信号か、あるいは音声認識装
置(音声認識ボード)7の出力に基づいて、句点や読点
で発生する無音状態を判別し、発生時点で信号を計時手
段M7に送る。計時手段M7は、以前に発生した無音状
態から、今回の無音状態に至るまでの経過時間を計時
し、読み上げ速度比較手段M9に送る。
On the other hand, the silent state determining means M8 determines a silent state occurring at a punctuation mark or a reading point based on a voice signal from the microphone 40 or an output of the voice recognition device (voice recognition board) 7. At this point, a signal is sent to the timing means M7. The timer M7 counts the elapsed time from the previously generated silent state to the current silent state, and sends the elapsed time to the reading speed comparing means M9.

【0029】読み上げ速度比較手段M9は、前記所要時
間演算手段M6から入力された読み上げ所要時間と、前
記計時手段M7から入力された経過時間を比較して、所
定の読み上げ速度との差を検出し、結果を出力/表示装
置2に送り、出力/表示させる。読み上げ速度が所定速
度よりも速いか、あるいは遅い場合は、この表示を見て
アナウンサーが直ちに自ら速度調整することができる。
The reading speed comparing means M9 compares the required reading time input from the required time calculating means M6 with the elapsed time input from the time measuring means M7, and detects a difference between the reading speed and a predetermined reading speed. The result is sent to the output / display device 2 for output / display. If the reading speed is faster or slower than the predetermined speed, the announcer can immediately adjust the speed by watching this display.

【0030】図2は、本発明に係る番組送出装置の一実
施形態の機器構成図である。同図で、符号1は本番組送
出装置の要部機器であるパーソナルコンピュータ(パソ
コン)のCPUであり、符号2はパソコン1での出力/
表示装置である。出力/表示装置2は、主としてCRT
モニターあるいはLCDモニターである。符号3はパソ
コン内のメモリ(RAMおよびROM)で、入出力表示
およびその他の各種情報を蓄積する。符号4はパソコン
のキーボードより入力されたかな文字を漢字に変換す
る、かな漢字変換機構である。
FIG. 2 is an apparatus configuration diagram of an embodiment of a program transmission device according to the present invention. In the figure, reference numeral 1 denotes a CPU of a personal computer (personal computer) which is a main device of the program transmitting apparatus, and reference numeral 2 denotes an output /
A display device. The output / display device 2 is mainly a CRT
Monitor or LCD monitor. Reference numeral 3 denotes memories (RAM and ROM) in the personal computer, which store input / output displays and other various information. Reference numeral 4 denotes a kana-kanji conversion mechanism for converting kana characters input from a personal computer keyboard into kanji.

【0031】符号5は外部の機器制御のための汎用のイ
ンタフェース回路(例えばSCSIインタフェース回
路)であり、符号6は番組送出を行う制御装置20に接
続するRS−232Cインタフェース回路である。
Reference numeral 5 denotes a general-purpose interface circuit (for example, a SCSI interface circuit) for controlling external devices, and reference numeral 6 denotes an RS-232C interface circuit connected to the control device 20 for transmitting a program.

【0032】符号7は音声認識手段(具体的には、音声
認識ボード)であり、外部からの音声の電気信号をコン
ピュータで処理できるコード情報に変換する。実際は後
述するスイッチャーからの音声出力が接続される。符号
8はSCSIインタフェース回路5により接続されたハ
ードディスク(HD)装置であり、送出用の各種情報や
パソコン内部で生成したニュース原稿ファイル等を蓄積
している。
Reference numeral 7 denotes a voice recognition means (specifically, a voice recognition board), which converts an external voice electric signal into code information that can be processed by a computer. Actually, an audio output from a switcher described later is connected. Reference numeral 8 denotes a hard disk (HD) device connected by the SCSI interface circuit 5, which stores various information for transmission, a news manuscript file generated inside the personal computer, and the like.

【0033】符号20は番組送出を行う制御装置で、符
号21は制御装置20内の制御を司るマイクロプロセッ
サよりなるCPUで、符号22はCPU21が動作する
上で必要となる情報、特にパソコンから通知される番組
情報を保持するワーキングメモリからなる。符号23は
外部の機器制御のための汎用のインタフェース回路であ
り、具体的にはRS−232Cインタフェース回路で構
成される。
Reference numeral 20 denotes a control device for transmitting a program, reference numeral 21 denotes a CPU composed of a microprocessor for controlling the inside of the control device 20, and reference numeral 22 denotes information necessary for the operation of the CPU 21, in particular, notification from a personal computer. It consists of a working memory that holds program information to be executed. Reference numeral 23 denotes a general-purpose interface circuit for controlling an external device, specifically, an RS-232C interface circuit.

【0034】符号24、25、26、27も同様にイン
タフェース回路であり、具体的にはRS−422インタ
フェース回路で構成される。符号28もインタフェース
回路であるが、外部からの時刻信号をコンピュータ用の
データに変換する時刻変換回路である。
Similarly, reference numerals 24, 25, 26, and 27 denote interface circuits, specifically, an RS-422 interface circuit. Reference numeral 28 denotes an interface circuit, which is a time conversion circuit for converting an external time signal into data for a computer.

【0035】符号30は送出用の画像/音声を生成する
スイッチャーで、各機器からの画像/音声を切り替え、
あるいは画像の合成や音声のミキシングを行い、インタ
フェース回路24によりCPU21から制御される。
Reference numeral 30 denotes a switcher for generating images / sounds for transmission, which switches images / sounds from respective devices.
Alternatively, image synthesis and audio mixing are performed, and the interface circuit 24 controls the CPU 21.

【0036】符号31はインタフェース回路25により
CPU21から制御されるビデオテープレコーダ(VT
R)であり、符号32はインタフェース回路26により
CPU21から制御される静止画発生装置であり、符号
33はインタフェース回路27によりCPU21から制
御される文字発生装置(CG)である。また符号34は
スタジオカメラである。これらの機器の画像/音声がス
イッチャー30により送出に利用される。符号35は時
刻発生器で、時刻変換回路28経由で時刻をCPU21
へ通知する。
Reference numeral 31 denotes a video tape recorder (VT) controlled from the CPU 21 by the interface circuit 25.
R), reference numeral 32 denotes a still image generation device controlled by the CPU 21 by the interface circuit 26, and reference numeral 33 denotes a character generation device (CG) controlled by the CPU 21 by the interface circuit 27. Reference numeral 34 denotes a studio camera. Images / audios of these devices are used for transmission by the switcher 30. Reference numeral 35 denotes a time generator which outputs the time via the time conversion circuit 28 to the CPU 21.
Notify to

【0037】係る構成において、パソコンCPU1は操
作員の操作により入力されたニュース原稿の表示やHD
8への蓄積を行い、ニュース番組の送出を指示された場
合、図3のような画面をモニター2に表示し、指示に応
じて番組の送出を行う。
In such a configuration, the personal computer CPU 1 displays the news manuscript input by the operation of the
When a command to send a news program is issued, a screen as shown in FIG. 3 is displayed on the monitor 2, and the program is sent according to the command.

【0038】図3は、番組表の画面の例を示す図であ
る。これはプレイリストと称されるもので、図示しない
作成用の画面で作成され、パソコン内蔵のハードディス
クHD9に蓄積されている。
FIG. 3 is a diagram showing an example of a screen of a program table. This is called a play list, which is created on a creation screen (not shown) and stored in the hard disk HD 9 built in the personal computer.

【0039】図3のプレイリストの構成中で、項目の欄
ではアナウンサー等が異なる場合に項目番号を異なるも
のにするように指定する。例えば、同図でCAM−1
(カメラ1)は撮影する素材であり、アナID欄で読み
上げ担当のアナウンサーが佐藤氏である様子を示してい
る。また、チェックの欄は、後述する喋りの内容や読み
上げ速度をチェックするか否かを示すマークである。
In the structure of the play list shown in FIG. 3, in the item column, when the announcer or the like is different, the item number is designated to be different. For example, in FIG.
(Camera 1) is a material to be photographed, and shows that the announcer in charge of reading out in the ANA ID column is Mr. Sato. The check column is a mark indicating whether or not to check the content of speech and the reading speed, which will be described later.

【0040】マークは、空欄あるいは’00’であれば
アナウンス内容や読み上げ速度のチェックを行わない旨
を示し、’01’でアナウンスの内容をチェックするこ
とを示し、’10’で読み上げ速度をチェックすること
を示し、さらに’11’であればアナウンス内容および
読み上げ速度の両方をチェックすることを示す。
If the mark is blank or '00', it indicates that the announcement content and the reading speed are not checked, '01' indicates that the announcement content is to be checked, and '10' indicates the reading speed. If "11", it indicates that both the announcement content and the reading speed are to be checked.

【0041】通常は、図3に示された”開始”ボタンが
押されることで、パソコンは制御装置20に制御装置用
のプレイリストをRS−232Cインタフェース回路
6、および23経由でCPU21に通知する。CPU2
1は、制御装置用のプレイリストを解析し、指示された
時刻に指示された画像(場合によっては合成を含む)を
出力するように、VTR31等の各機器を制御する。具
体的には、プレイリスト上の該当素材の送出直前になる
と、素材の準備を該当する機械に汎用インタフェース経
由で指示する。送出時刻になると、素材の再生を行い、
スイッチャー30に対して切り替え命令を発行する。
Normally, when the "start" button shown in FIG. 3 is pressed, the personal computer notifies the control device 20 of the play list for the control device to the CPU 21 via the RS-232C interface circuits 6 and 23. . CPU2
1 analyzes the playlist for the control device and controls each device such as the VTR 31 so as to output the designated image (including the combination in some cases) at the designated time. Specifically, immediately before the transmission of the corresponding material on the play list, an instruction for preparing the material is given to the corresponding machine via the general-purpose interface. At the transmission time, the material is played,
A switching command is issued to the switcher 30.

【0042】図4は、ニュースの放送用の画面を概念的
に示したもので、アナウンサーと字幕(文字列)や静止
画の合成等を行うことで放送を行う。
FIG. 4 conceptually shows a screen for broadcasting news. Broadcasting is performed by synthesizing subtitles (character strings) and still images with an announcer.

【0043】図5は、ニュース用原稿の表示例を示す図
である。この表示は、ニュース原稿作成用の端末や図3
でのプレイリスト画面で該当するニュース枠をクリック
することで、表示や印刷が可能である。
FIG. 5 is a diagram showing a display example of a news manuscript. This display is displayed on the terminal for creating the news manuscript or in FIG.
By clicking on the relevant news frame on the playlist screen in, display and printing are possible.

【0044】図6は、原稿ファイル及びかなファイルの
構成例を示す図である。原稿ファイル及びかなファイル
は、いずれもハードディスクHD上に作成されるファイ
ルであり、原稿本文は原稿そのものの漢字混じりの文で
ある。ファイル名の先頭の”N”はNewsの意味であ
り、その後に年月日を示す6文字、そして同一日内での
識別子(”M”:朝”N”:昼”E”:夕方)そして構
成/項目番号が示される。また、拡張子により、原稿の
本文(”TXT”)、かな文字ファイル(”KAN”)
が示される。
FIG. 6 is a diagram showing a configuration example of a manuscript file and a kana file. The manuscript file and the kana file are both files created on the hard disk HD, and the manuscript text is a sentence of the manuscript itself mixed with kanji. "N" at the beginning of the file name means News, followed by six characters indicating the date, an identifier within the same day ("M": morning "N": daytime "E": evening) and the structure. / Item number is indicated. Also, depending on the extension, the text of the manuscript (“TXT”), the kana character file (“KAN”)
Is shown.

【0045】かな文字ファイルは、後述する読み上げの
チェック等に使用される。例えば、”大雨は”は、かな
文字ファイルでは”オオアメワ”となる。
The kana character file is used for a reading check, which will be described later. For example, “heavy rain” is “Oamewa” in the kana character file.

【0046】図7は、本実施形態での送出中の原稿の画
面を示すもので、原稿そのものと、しゃべりそのものや
スピードのチェックの結果を表示する。同図では、ニュ
ース部分を、例えば間違って放送中にニューズと読み上
げた際に、その部分’ス’が読み間違った旨を、マーク
Mk1によって表示している。
FIG. 7 shows a screen of a document being sent according to the present embodiment, in which the document itself, the chatter itself and the result of the speed check are displayed. In the figure, when the news part is read aloud by mistake during a broadcast, for example, a mark Mk1 indicates that the part "s" is erroneously read.

【0047】また、画面下段のスピードマークMk2を
中心0からプラス側に移動させて表示することで、読み
上げ速度が若干早すぎることを示している。さらに、”
皆さん注意してください”の部分のカーソルMk3は、
一旦エラーが発生したことで次のチェックをどの文から
行うかを操作員が示したもので、CPU1は一旦エラー
を通知しながらも、エラー解除のボタンBt1がクリッ
クされた場合、次の文まで文字認識を行わず(具体的に
は、文としてのから読みを行う)、次の文からチェック
を行う。これは、例えば、アナウンサー自らが間違った
旨の言葉を発した場合、それ自体がニュース原稿と異な
り、エラーとして扱って、そのままではその後に正しい
原稿のしゃべりを行ってもずれのためにエラーとして扱
う等の不都合を回避するためである。
Further, by moving the speed mark Mk2 at the lower part of the screen from the center 0 to the plus side and displaying it, it indicates that the reading speed is slightly too high. further,"
Please be careful everyone ”is the cursor Mk3
Once the error has occurred, the operator indicates from which statement the next check is to be performed. The CPU 1 notifies the error once, but if the error release button Bt1 is clicked, the CPU 1 continues to the next statement. Character recognition is not performed (specifically, reading is performed as a sentence), and checking is performed from the next sentence. This is because, for example, if the announcer himself makes a word to the effect that it is wrong, it is treated as an error, unlike a news manuscript itself, and even if the correct manuscript is spoken after that as it is, it is treated as an error due to misalignment This is to avoid such inconveniences.

【0048】さらに、原稿と読み上げ(しゃべり)が一
致しない場合として、原稿にない言葉や、文章を発する
場合がある。その場合は、図7で発生した部分に赤い線
を表示するものとする。例えば、原稿が”ニュースで
す”であるのに、”ニュースがです”と読み上げた場
合、図7では”ニュース”と”です”の間に赤線(図7
では示されていない)を表示する。
Furthermore, as a case where the manuscript does not match the reading (speaking), there is a case where a word or a sentence not present in the manuscript is uttered. In that case, a red line is displayed at the portion where the error occurred in FIG. For example, if the manuscript reads “News” but reads “News is”, in FIG. 7, a red line (“Fig.
(Not shown).

【0049】また、”エー”とか”アー”といった不規
則音を発する場合があると、前記同様に橙色の線(図7
では示されていない)を表示する。
When an irregular sound such as "A" or "A" is emitted, an orange line (FIG.
(Not shown).

【0050】図8は、読み上げ速度チェック用のファイ
ル構造を示す図である。また図9は、各担当者毎の音声
パラメータファイル構造を示す図である。これらは、H
D9上に記憶している、アナウンサーに対する読み上げ
チェックのためのファイルであり、読み上げのスピード
と音声認識のためのパラメータファイル名称が各アナウ
ンサーごとに判明するようになっている。
FIG. 8 is a diagram showing a file structure for reading speed check. FIG. 9 is a diagram showing a voice parameter file structure for each person in charge. These are H
This is a file stored on D9 for reading aloud to an announcer. The speed of reading aloud and the name of a parameter file for voice recognition are determined for each announcer.

【0051】CPU1は、チェックする旨の項目を送出
する直前に、音声認識のためのパラメータを音声認識ボ
ード7に通知する。音声認識ボードはこの情報を元に認
識結果をCPU1へ通知する。これら、音声認識パラメ
ータの通知および音声認識結果の通知はAPI経由で行
われる。また、送出の際には、CPU1は、認識結果の
取り出しと同時に時刻情報の取り込みを行い、図8での
読み上げスピードにより読み上げのスピードを判別し、
その旨を表示する。
The CPU 1 notifies the voice recognition board 7 of the parameters for voice recognition immediately before sending the item to be checked. The voice recognition board notifies the CPU 1 of a recognition result based on this information. The notification of the voice recognition parameter and the notification of the voice recognition result are performed via the API. At the time of transmission, the CPU 1 takes in the time information at the same time as taking out the recognition result, and determines the reading speed based on the reading speed in FIG.
Display that effect.

【0052】なお、図8で示されたアナウンサーごとの
読み上げのスピードは、ここでは記載しないニュース原
稿作成の画面で利用するもので、ニュース原稿で入力し
た文字数に対してその項目の長さ(DUR)が不適切な
場合にその旨を表示するためのものである。実際は、標
準のスピードに対してDURがどれほどずれているかを
示す。佐藤アナウンサーの場合、300文字/1分が標
準で、250文字/1分以下や、350文字/1分以上
となるとエラーを表示するように設定されている。
Note that the reading speed for each announcer shown in FIG. 8 is used in a screen for creating a news manuscript not described here, and the length of the item (DUR) relative to the number of characters input in the news manuscript is used. ) Is to indicate when inappropriate. In fact, it shows how much the DUR deviates from the standard speed. In the case of the Sato announcer, 300 characters / 1 minute is set as a standard, and an error is set to be displayed when it becomes 250 characters / 1 minute or less, or 350 characters / 1 minute or more.

【0053】図10は、本発明に係る番組送出装置の一
実施形態の動作フローチャートである。また図11は、
図10に続く動作フローチャートであり、図12は、図
11に続く動作フローチャートである。CPU1は、図
10〜図12にわたる動作によって、読み上げ速度チェ
ックの指示がある場合の項目でのチェックを行う。
FIG. 10 is an operation flowchart of an embodiment of the program transmitting apparatus according to the present invention. FIG.
FIG. 12 is an operation flowchart following FIG. 10, and FIG. 12 is an operation flowchart following FIG. The CPU 1 performs a check on an item in the case where there is a reading speed check instruction through the operations illustrated in FIGS. 10 to 12.

【0054】同図で、ニュース原稿入力があると(ステ
ップ96)、かな文字ファイルを編成し(ステップ9
7)、ついで担当者情報を読みだして(ステップ9
8)、音声パラメータを設定する(ステップ99)。開
始15秒前になると(ステップ100)、項目に相当す
るニュース原稿ファイルを取り込む(ステップ10
1)。
In the figure, when a news manuscript is input (step 96), a kana character file is organized (step 9).
7) Then, the person in charge is read out (step 9)
8), voice parameters are set (step 99). 15 seconds before the start (step 100), a news manuscript file corresponding to the item is fetched (step 10).
1).

【0055】取り込んだファイルに基づいて文字数を算
出し(ステップ102)、フレームに変換する(ステッ
プ103)。ついで各文字数ごとのフレーム数を算出す
る(ステップ104)。ここでフレームとは画像信号で
の最小単位であり、本実施形態では信号形態として、日
本や北米で使用されているNTSCを採用するから、1
秒が30フレームとなる。
The number of characters is calculated based on the fetched file (step 102) and converted into a frame (step 103). Next, the number of frames for each number of characters is calculated (step 104). Here, a frame is the minimum unit in an image signal. In the present embodiment, NTSC used in Japan and North America is adopted as a signal form, so
The second is 30 frames.

【0056】ステップ104で各文字数ごとのフレーム
数を算出しておくのは、画像がフレーム単位であるため
精度をフレームにすれば十分であることによる。さらに
1文字以外に10文字や100文字でのフレーム数を算
出しておくのは、フレームに丸めたことによる累積誤差
を少なくするためである。
The reason for calculating the number of frames for each number of characters in step 104 is that it is sufficient to set the accuracy to frames since the image is in units of frames. Further, the number of frames for 10 or 100 characters other than one character is calculated in order to reduce the accumulated error caused by rounding the frame.

【0057】項目開始時刻となって(ステップ10
5)、終了時刻をチェックするステップ106を通過
し、やがて音声入力が発生すれば(ステップ109)、
句点までの音声情報の取り込み、すなわち1文の取り込
みを行う(ステップ112)。この直後に、前もって次
に比較する文字列(文)の指示を行う(ステップ11
3)。
The item start time is reached (step 10
5) After passing through the step 106 for checking the end time, if a voice input occurs soon (step 109),
The voice information up to the period, that is, one sentence is captured (step 112). Immediately after this, a character string (sentence) to be compared next is specified in advance (step 11).
3).

【0058】その後ステップ114で、音声認識での文
字列と原稿上の文字列を比較し、一致していない場合は
その旨を表示する。こののち、ステップ106に戻る。
ステップ108は、エラー発生した際のエラーのクリア
が指示されているかの判断であり、エラークリアされた
場合は音声認識からの文字列を読み飛ばし(ステップ1
10)、クリアボタンが押されなくなった時点で次とし
て指示された文を次に比較する文字列(文)として指示
しておき(ステップ111)、ついでステップ109以
降の音声入力の判断や文字列比較を実行する。
Thereafter, in step 114, the character string in the voice recognition is compared with the character string on the document, and if they do not match, a message to that effect is displayed. Thereafter, the process returns to step 106.
Step 108 is for judging whether or not an error clear instruction has been issued when an error has occurred. If the error has been cleared, the character string from the voice recognition is skipped (Step 1).
10) When the clear button is no longer pressed, the sentence designated next is designated as a character string (sentence) to be compared next (step 111). Perform a comparison.

【0059】なお、単語のチェックの指示が行われてい
る場合は、ステップ114で文字列を順次HD8内の不
正な単語と一致するものがないかチェックし、一致する
ものがあればその旨を表示する。
If an instruction to check a word has been given, the character string is sequentially checked in step 114 for any one that matches an invalid word in the HD 8. indicate.

【0060】一方、ステップ109で音声入力が発生す
れば、計時を開始し(ステップ121)、無音状態発生
までの経過時間を計時する(ステップ122)。これに
より読み上げ速度を比較し、結果を表示する。これによ
って進行時間の管理が為されることになる。
On the other hand, if a voice input occurs in step 109, time counting is started (step 121), and the elapsed time until the occurrence of a silent state is timed (step 122). Thereby, the reading speed is compared and the result is displayed. As a result, the progress time is managed.

【0061】なお、前記の実施形態においては、読み上
げの識別をカタカナ文字ファイルにより行ったが、他の
文字(ひらがなファイルや2バイト漢字コードでのかな
ファイル)を使用してもでも同様に構成することができ
る。
In the above-described embodiment, the identification of the reading is performed using the katakana character file. However, the same configuration can be used even if other characters (a hiragana file or a two-byte kanji code kana file) are used. be able to.

【0062】また、前記の実施形態は日本語に適用され
たものであったが、英語や他の言語へ応用することも可
能である。
Although the above embodiment is applied to Japanese, it is also possible to apply to English and other languages.

【0063】さらに、前記の実施形態では読み上げのス
ピードチェックを句点により行ったが、句読点や1文字
ごとに行うようにすることも可能である。
Further, in the above-described embodiment, the reading speed check is performed based on punctuation marks. However, it is also possible to perform punctuation marks or individual characters.

【0064】また、前記の実施形態では用語のチェック
を句点により行ったが、句読点や1文字ごとに行うよう
にすることも可能である。
In the above-described embodiment, the term check is performed based on the punctuation marks. However, it is also possible to perform the punctuation marks or the individual characters.

【0065】また、前記の実施形態はニュース番組に適
用したものであったが、例えば、ドラマや洋画やアニメ
の吹き替え等へ適用することも可能である。
Although the above embodiment has been applied to a news program, it can be applied to, for example, dubbing of a drama, a foreign film, or an animation.

【0066】[0066]

【発明の効果】以上詳述したように、本発明の請求項1
に係る番組送出装置は、番組用の原稿を作成し、番組を
送出する番組送出装置において 読み上げを行う各担当
者の音声パラメータを記憶する記憶手段と、原稿に対す
る読み上げ用のかな文字ファイルと、読み上げを行う担
当者情報の記憶手段と、読み上げを行う担当者情報に基
づいて選択される音声パラメータを用いて、読み上げを
行う担当者の音声を認識する手段と、かな文字ファイル
の内容と担当者の読み上げ内容との一致判別を行う比較
手段とを具備して構成するものであるから、従来のよう
な特殊用語とかな文字との変換作業の重複がなくなり、
よってニュース等の原稿の読み上げ内容と原稿との一致
判別を効率的にすることができる。しかも、ニュース等
の原稿の読み違いや、不適切な用語の使用の監視を自動
的に行うことができる。
As described in detail above, claim 1 of the present invention
The program sending device according to the present invention creates a program manuscript, and in the program sending device that sends out the program, a storage means for storing voice parameters of each person who performs reading, a kana character file for reading the manuscript, Means for recognizing the voice of the person in charge of reading using the voice parameter selected based on the information of the person in charge of reading, and means for storing the contents of the kana character file and the person in charge of the person in charge. Since it is configured to include a comparison means for determining the coincidence with the read-out content, there is no duplication of conversion work between a special term and a kana character as in the related art,
Therefore, it is possible to efficiently determine whether the read content of the original such as news matches the original. In addition, it is possible to automatically monitor misreading of a manuscript such as news and the use of inappropriate terms.

【0067】更に、音声認識の認識精度を向上できるか
ら、各話者毎の判別精度を向上でき、よって誤差の少な
い判別が可能になる。
Further, since the recognition accuracy of voice recognition can be improved, the accuracy of discrimination for each speaker can be improved, and thus, discrimination with less error can be performed.

【0068】本発明の請求項2に係る番組送出装置は、
前記請求項1記載の構成において、かな文字ファイルの
部分における読み上げの際の時間長の演算手段と、句点
等の無音状態の判別手段を有し、前記の一致判別を行う
比較手段で前記演算手段により設定した時間長に対し口
頭での喋りの進行状況を自動判別する構成とするもので
あるから、ニュース等の原稿の読み上げスピードと実際
の読み上げが一致しているかの監視を自動的に実行で
き、よって番組進行の時間管理を迅速かつ高精度でなす
ことができるという効果がある。
According to a second aspect of the present invention, there is provided a program transmitting apparatus comprising:
2. The configuration according to claim 1, further comprising a calculation unit for calculating a time length at the time of reading out a kana character file portion, and a determination unit for determining a silent state such as a period, and a comparison unit for performing the matching determination. It is designed to automatically determine the progress of the verbal speech for the time length set by, so it can automatically monitor whether the reading speed of the original such as news and the actual reading are the same. Therefore, there is an effect that time management of program progress can be performed quickly and with high accuracy.

【0069】本発明の請求項3に係る番組送出装置は、
前記請求項1または2記載の構成において、単語の記憶
手段と口頭で喋る内容との比較手段を有し、記憶手段内
の単語が発生した場合、その旨を表示する構成とするも
のであるから、実時間中に発生する不規則発音を、判別
において効果的に除去でき、よって判別精度を向上させ
ることができるいう効果を奏する。
According to a third aspect of the present invention, there is provided a program transmitting apparatus comprising:
The configuration according to claim 1 or 2, further comprising a storage unit for the word and a comparison unit for comparing the contents spoken orally, and when a word in the storage unit occurs, the fact is displayed. In addition, irregular sounds generated during real time can be effectively removed in the discrimination, so that the discrimination accuracy can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る番組送出装置の一実施形態の要部
ブロック構成図である。
FIG. 1 is a block diagram of a main part of an embodiment of a program transmission device according to the present invention.

【図2】本発明に係る番組送出装置の一実施形態の機器
構成図である。
FIG. 2 is an apparatus configuration diagram of an embodiment of a program transmission device according to the present invention.

【図3】番組表の画面の例を示す図である。FIG. 3 is a diagram illustrating an example of a screen of a program guide.

【図4】ニュース放送用画面の概念図である。FIG. 4 is a conceptual diagram of a news broadcast screen.

【図5】ニュース用原稿の表示例を示す図である。FIG. 5 is a diagram illustrating a display example of a news manuscript.

【図6】原稿ファイル及びかなファイルの構成例を示す
図である。
FIG. 6 is a diagram illustrating a configuration example of a manuscript file and a kana file.

【図7】送出中の原稿の画面例を示す図である。FIG. 7 is a diagram illustrating an example of a screen of a document being sent.

【図8】読み上げ速度チェック用のファイル構造を示す
図である。
FIG. 8 is a diagram showing a file structure for reading speed check.

【図9】各担当者毎の音声パラメータファイル構造を示
す図である。
FIG. 9 is a diagram showing a voice parameter file structure for each person in charge.

【図10】本発明に係る番組送出装置の一実施形態の動
作フローチャートである。
FIG. 10 is an operation flowchart of one embodiment of a program transmission device according to the present invention.

【図11】図10に続く動作フローチャートである。FIG. 11 is an operation flowchart following FIG. 10;

【図12】図11に続く動作フローチャートである。FIG. 12 is an operation flowchart following FIG. 11;

【符号の説明】 F1…原稿ファイル(漢字混じり)、F2…かな文字フ
ァイル、M1…制御手段、M2…かな文字ファイル編成
手段、M3…担当者情報記憶手段、M4…音声パラメー
タ記憶手段、M5…一致判別のための比較手段、M6…
所要時間演算手段、M7…計時手段、M8…無音状態判
別手段、M9…読み上げ速度比較手段、M10…単語記
憶手段、2…出力/表示装置、7…音声認識装置(音声
認識ボード)、40…マイクロフォン。
[Description of Signs] F1: manuscript file (mixed with kanji), F2: kana character file, M1: control means, M2: kana character file organization means, M3: staff information storage means, M4: voice parameter storage means, M5 ... Comparison means for determining coincidence, M6 ...
Required time calculation means, M7 ... time counting means, M8 ... silence state discriminating means, M9 ... reading speed comparison means, M10 ... word storage means, 2 ... output / display device, 7 ... voice recognition device (voice recognition board), 40 ... microphone.

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 番組用の原稿を作成し、番組を送出する
番組送出装置において、 読み上げを行う各担当者の音声パラメータを記憶する記
憶手段と、 原稿に対する読み上げ用のかな文字ファイルと、 読み上げを行う担当者情報の記憶手段と、 前記読み上げを行う担当者情報に基づいて選択される音
声パラメータを用いて、読み上げを行う担当者の音声を
認識する手段と、 前記かな文字ファイルの内容と読み上げ担当者の音声認
識内容との一致判別を行う比較手段と、を具備すること
を特徴とする番組送出装置。
1. A program sending device for creating a program manuscript and sending the program, a storage means for storing voice parameters of each person who performs reading, a kana character file for reading the manuscript, Means for storing information of a person in charge of reading, means for recognizing the voice of the person in charge of reading using voice parameters selected based on the information of the person in charge of reading, and And a comparing means for judging coincidence with the voice recognition content of the user.
【請求項2】 前記かな文字ファイルの部分における読
み上げの際の時間長の演算手段と、句点等の無音状態の
判別手段を有し、前記の一致判別を行う比較手段で前記
演算手段により設定した時間長に対し口頭での喋りの進
行状況を判別することを特徴とする請求項1記載の番組
送出装置。
2. A computer according to claim 1, further comprising means for calculating the length of time for reading out the kana character file portion, and means for determining a silent state such as a punctuation mark. 2. The program transmitting apparatus according to claim 1, wherein the progress of the verbal conversation is determined with respect to the time length.
【請求項3】 単語の記憶手段と口頭で喋る内容との比
較手段を有し、記憶手段内の単語が発生した場合、その
旨を表示することを特徴とする請求項1または2記載の
番組送出装置。
3. The program according to claim 1, further comprising a word storage means and a means for comparing the contents spoken orally, and when a word in the storage means is generated, the fact is displayed. Sending device.
JP9116758A 1997-05-07 1997-05-07 Program transmitter Pending JPH10308887A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9116758A JPH10308887A (en) 1997-05-07 1997-05-07 Program transmitter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9116758A JPH10308887A (en) 1997-05-07 1997-05-07 Program transmitter

Publications (1)

Publication Number Publication Date
JPH10308887A true JPH10308887A (en) 1998-11-17

Family

ID=14695019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9116758A Pending JPH10308887A (en) 1997-05-07 1997-05-07 Program transmitter

Country Status (1)

Country Link
JP (1) JPH10308887A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132287A (en) * 2000-10-20 2002-05-09 Canon Inc Speech recording method and speech recorder as well as memory medium
JP2003076386A (en) * 2001-08-31 2003-03-14 Toa Corp Method and device for vicarious performance of announcement
WO2009078256A1 (en) * 2007-12-18 2009-06-25 Nec Corporation Pronouncing fluctuation rule extraction device, pronunciation fluctuation rule extraction method and pronunciation fluctation rule extraction program
JP2016045467A (en) * 2014-08-26 2016-04-04 日本放送協会 Utterance evaluation device, utterance evaluation method and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132287A (en) * 2000-10-20 2002-05-09 Canon Inc Speech recording method and speech recorder as well as memory medium
JP2003076386A (en) * 2001-08-31 2003-03-14 Toa Corp Method and device for vicarious performance of announcement
JP4612976B2 (en) * 2001-08-31 2011-01-12 ティーオーエー株式会社 Announcement substitution method and apparatus
WO2009078256A1 (en) * 2007-12-18 2009-06-25 Nec Corporation Pronouncing fluctuation rule extraction device, pronunciation fluctuation rule extraction method and pronunciation fluctation rule extraction program
JP5327054B2 (en) * 2007-12-18 2013-10-30 日本電気株式会社 Pronunciation variation rule extraction device, pronunciation variation rule extraction method, and pronunciation variation rule extraction program
US8595004B2 (en) 2007-12-18 2013-11-26 Nec Corporation Pronunciation variation rule extraction apparatus, pronunciation variation rule extraction method, and pronunciation variation rule extraction program
JP2016045467A (en) * 2014-08-26 2016-04-04 日本放送協会 Utterance evaluation device, utterance evaluation method and program

Similar Documents

Publication Publication Date Title
CA2365463C (en) Method and apparatus for enhancing digital images with textual explanations
US6332122B1 (en) Transcription system for multiple speakers, using and establishing identification
JP4972645B2 (en) System and method for synchronizing sound and manually transcribed text
US6226615B1 (en) Spoken text display method and apparatus, for use in generating television signals
US8311832B2 (en) Hybrid-captioning system
US6460056B1 (en) Method and apparatus for displaying sign language images corresponding to input information
US20070011012A1 (en) Method, system, and apparatus for facilitating captioning of multi-media content
CN111050201B (en) Data processing method and device, electronic equipment and storage medium
JPWO2018216729A1 (en) Audio guide generation device, audio guide generation method, and broadcast system
JP2014222290A (en) Minute recording device, minute recording method, and program
CN110781649A (en) Subtitle editing method and device, computer storage medium and electronic equipment
JP4140745B2 (en) How to add timing information to subtitles
JPH10308887A (en) Program transmitter
JP2004302175A (en) System, method, and program for speech recognition
JP3682922B2 (en) Real-time character correction device and real-time character correction program
JP4210723B2 (en) Automatic caption program production system
US20230109852A1 (en) Data processing method and apparatus, device, and medium
US20070087312A1 (en) Method for separating sentences in audio-video display system
Ando et al. Simultaneous subtitling system for broadcast news programs with a speech recognizer
JP2000206987A (en) Voice recognition device
JP2007163568A (en) Input apparatus for digest scene, input method therefor, program for this method, and recording medium recorded with this program
JP4175141B2 (en) Program information display device having voice recognition function
JP2006317548A (en) Educational content generating device
JP2007078985A (en) Data retrieving device and its control method
CN114503546A (en) Subtitle display method, device, electronic equipment and storage medium