JP2005227944A - Character information acquisition device - Google Patents
Character information acquisition device Download PDFInfo
- Publication number
- JP2005227944A JP2005227944A JP2004034673A JP2004034673A JP2005227944A JP 2005227944 A JP2005227944 A JP 2005227944A JP 2004034673 A JP2004034673 A JP 2004034673A JP 2004034673 A JP2004034673 A JP 2004034673A JP 2005227944 A JP2005227944 A JP 2005227944A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- output
- input
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
Description
本発明は、表示画像中に含まれるURL情報やメールアドレスなどを取得するインターネット情報取得装置に関し、さらに詳述すれば、インターネット情報取得装置を組み込んだインターネット接続機能を有する映像表示装置に関する。 The present invention relates to an Internet information acquisition apparatus that acquires URL information, a mail address, and the like included in a display image. More specifically, the present invention relates to a video display apparatus having an Internet connection function incorporating the Internet information acquisition apparatus.
近年のパーソナルコンピュータやインターネット機能付き携帯電話の急速な普及と共に、インターネットの利用が拡大している。また、テレビ放送中の番組において、当該番組自身や番組で紹介した商品や場所などの情報が提供されているホームページのURL情報を映像や音声で表示して、視聴者が当該ホームページにアクセスしてさらに情報を獲得できるような便宜を図っている。また、放送される各社のオリジナルCMなどでも、商品情報や会社概要などが紹介されているホームページのURLが頻繁に表示されている。その映像の一部として送られてくるテロップなどの文字情報を抜き出し、コンテンツ視聴などに利用する手法として、例えば特開2003−069914号公報などがある。
しかしながら、画像の一部である文字列を抜き取る場合、文字情報としては静止しているが、文字情報の背景は動画となっていることが多く、文字情報の抜き取り精度が悪く結果として文字情報としての精度が損なわれてしまう場合があり、所望するコンテンツデータが取得できないなどの不具合が生じやすい。 However, when extracting a character string that is a part of an image, the character information is stationary, but the background of the character information is often a moving image, and the accuracy of extracting the character information is poor, resulting in character information. May be impaired, and problems such as failure to obtain desired content data are likely to occur.
第1の発明は、入力映像信号に対し、その画像の一部として送信されてくる文字列を検出する文字列検出装置と、前記文字列検出装置の出力を入力とし、あらかじめ設定された特殊文字と一致する文字列があった場合、その文字列の前後のあらかじめ設定された長さの文字列のみを出力する第1の特殊文字認識装置と、前記第1の特殊文字認識装置の出力を入力とし、その内容をある一定期間保持しておくことができる第1の文字列候補蓄積装置と、入力音声信号を文字列に変換する音声認識装置と、前記音声認識装置の出力を入力とし、あらかじめ設定された特殊文字と一致する文字列があった場合、その文字列の前後のあらかじめ設定された長さの文字列のみを出力する第2の特殊文字認識装置と、前記第2の特殊文字認識装置の出力を入力とし、その内容をある一定期間保持しておくことができる第2の文字列候補蓄積装置と、前記第1の文字列候補蓄積装置および前記第2の文字列候補蓄積装置の出力を入力とし、2つの入力が一致すればその文字列を出力し、2つの文字列の一致の割合が高ければあらかじめ設定された補正率により文字列の補正を行いその補正された文字列を出力し、2つの文字列の一致の割合が低ければ前記第1の文字列候補蓄積装置の出力を出力する文字列補正装置と、前記文字列補正装置の出力を入力とし、その入力文字列を保持し、CPUの要求に従ってその文字列を出力する特殊文字記憶装置とを備え、映像信号の一部として送られてくる文字列を抜き取りその文字列をCPUにて用いる際に、音声信号情報を用いてその誤動作を抑え、精度の高い文字列情報を提供することを特徴とする。 According to a first aspect of the present invention, there is provided a character string detection device for detecting a character string transmitted as a part of an image for an input video signal, and an output of the character string detection device as an input, and a special character set in advance. When there is a character string that matches, the first special character recognition device that outputs only a character string of a predetermined length before and after the character string and the output of the first special character recognition device are input. A first character string candidate accumulating device capable of holding the contents for a certain period, a speech recognition device for converting an input speech signal into a character string, and an output of the speech recognition device as inputs, A second special character recognition device that outputs only a character string of a predetermined length before and after the character string when there is a character string that matches the set special character; and the second special character recognition The output of the device The second character string candidate accumulating device capable of holding the contents for a certain period of time, and the outputs of the first character string candidate accumulating device and the second character string candidate accumulating device as inputs. If the two inputs match, the character string is output, and if the two character strings match at a high rate, the character string is corrected at a preset correction rate, and the corrected character string is output. A character string correction device that outputs the output of the first character string candidate storage device if the rate of matching of the two character strings is low, and an output of the character string correction device as an input, holds the input character string, and a CPU A special character storage device that outputs the character string according to the request of the user, and when the character string sent as part of the video signal is extracted and used by the CPU, the malfunction is caused by using the audio signal information. Control accuracy And providing a higher character string information.
第2の発明は、入力映像信号に対し、その画像の一部として送信されてくる文字列を検出し、その文字を検出する際の確からしさを文字列に付与し出力する文字列情報検出装置と、前記文字列情報検出装置の出力を入力とし、あらかじめ設定された特殊文字と一致する文字列があった場合、その文字列の前後のあらかじめ設定された長さの文字列および確からしさのみを出力する第3の特殊文字認識装置と、前記第3の特殊文字認識装置の出力を入力とし、その内容をある一定期間保持しておくことができる第3の文字列候補蓄積装置と、入力音声信号を文字列に変換し、その文字に変換する際の確からしさを文字列に付与し出力する音声認識情報出力装置と、前記音声認識情報出力装置の出力を入力とし、あらかじめ設定された特殊文字と一致する文字列があった場合、その文字列の前後のあらかじめ設定された長さの文字列および確からしさのみを出力する第4の特殊文字認識装置と、前記第4の特殊文字認識装置の出力を入力とし、その内容をある一定期間保持しておくことができる第4の文字列候補蓄積装置と、前記第3の文字列候補蓄積装置および前記第4の文字列候補蓄積装置の出力を入力とし、2つの入力が一致すればその文字列を出力し、2つの文字列が一致しなければ文字列に付与された確からしさの情報により確からしさの大きい文字を選択し出力し、2つの文字列の一致の割合が低ければ前記第1の文字列候補蓄積装置の出力を出力する第2の文字列補正装置と、前記第2の文字列補正装置の出力を入力とし、その入力文字列を保持し、CPUの要求に従ってその文字列を出力する特殊文字記憶装置とを備え、映像信号の一部として送られてくる文字列を抜き取りその文字列をCPUにて用いる際に、音声信号情報を用いてその誤動作を抑え、精度の高い文字列情報を提供することを特徴とする。 According to a second aspect of the present invention, there is provided a character string information detecting device for detecting a character string transmitted as a part of an image from an input video signal, and adding the certainty to the character string when outputting the character string and outputting it. And the output of the character string information detection device as an input, and if there is a character string that matches a special character set in advance, only a character string of a predetermined length before and after the character string and the probability A third special character recognition device to output, a third character string candidate accumulating device which can receive the output of the third special character recognition device and keep the contents for a certain period, and input speech A speech recognition information output device that converts a signal into a character string, adds the probability of conversion to the character string to the character string and outputs it, and an output of the speech recognition information output device as an input, and a special character set in advance When When there is a matching character string, a fourth special character recognition device that outputs only a character string of a predetermined length before and after the character string and the probability, and an output of the fourth special character recognition device , And the output of the fourth character string candidate storage device, the third character string candidate storage device, and the fourth character string candidate storage device that can hold the contents for a certain period of time. If the two inputs match, the character string is output. If the two character strings do not match, a character with a high probability is selected and output based on the probability information given to the character string. If the string matching ratio is low, the second character string correcting device that outputs the output of the first character string candidate accumulating device and the output of the second character string correcting device are used as inputs. Hold and follow CPU request A special character storage device that outputs the character string, and when the character string sent as a part of the video signal is extracted and used by the CPU, the malfunction is suppressed using the audio signal information; It is characterized by providing highly accurate character string information.
本発明によれば、映像信号の一部として送信されているURL等の文字列情報を高精度に検出し、コンテンツ視聴などに利用することができる。 According to the present invention, character string information such as a URL transmitted as a part of a video signal can be detected with high accuracy and used for viewing content.
(実施の形態1)
図1を用いて説明を行う。101において入力した映像信号をパターン化して検出文字列10Aを得る。10Aは第1の特殊文字認識装置102に入力する。あらかじめ抽出したい特殊文字または文字列(以下、キーワードと称す)を設定し、文字列の比較を行う。ここではURL情報を抽出したいという設定を考え、「http」をキーワードに設定しておく。10Aに設定キーワードが存在した場合、そのキーワードから例えば後に続くURLに使用される可能性のある連続文字列をURL情報を含んだ情報10Bとして102の出力とする。102の出力10Bは第1の文字列候補蓄積装置103に入力される。103では、後述する第2の文字列候補蓄積装置に情報が蓄積されるまでに想定される時間保持しておく必要がある。このように抽出されたURL情報候補を103に蓄積していく。また、入力された音声信号は音声認識装置104で検出文字列10Dを得る。10Dは第1の特殊文字認識装置105に入力する。ここで、105の動作は102と同一で良いので省略する。105からURL情報を含んだ文字列情報10Eを得る。10Eは第2の文字列候補蓄積装置106に入力される。ここで、106の動作は103と同一で良いので省略する。このように抽出されたURL情報候補を106に蓄積していく。103および106に蓄積されている情報を107が読み出し、逐次比較を行う。ここで107ではまず、両者が完全に一致する場合はそのどちらかを出力する。また、両者が完全に一致しないが一致する文字が多い場合は、例えば一致する文字列はそのまま使用し、一致しない文字列については106の出力10Fを使用し、出力する。また、一致する文字が少ない場合は音声の情報がないとして103の出力をそのまま出力する。出力信号10Gは特殊文字記憶装置108に入力され、CPUにより108から別の記憶保持装置などに転送されるなどにより、精度の高いURL情報としてコンテンツ視聴などに利用される。
(Embodiment 1)
This will be described with reference to FIG. The detected
(実施の形態2)
図2および図3を用いて説明を行う。201において入力した映像信号をパターン化して検出文字列を得る。この文字を検出する際にはいくつかの方法があるが、パターン化された信号に対してパターン認識を行い、いくつかの候補の中から最も可能性の高いものを選択するという手法をとるとすると、例えばこのときの候補の数を確からしさの情報とすると、この候補の数が少ない方が確からしさが高いということになる。この数字を検出した文字に付与すれば、確からしさを含んだ文字列情報20Aを得ることができる(図3を参照)。20Aは第3の特殊文字認識装置202に入力する。202の動作は102と同様であるが、キーワードとの比較は、確からしさデータは無視する。202の出力20Bは第3の文字列候補蓄積装置203に入力される。203の動作は103と同様であるが、確からしさデータも同様に保持する。このため203は103よりも大きな容量を必要とする。このように抽出された確からしさを含んだURL情報候補を203に蓄積していく。また、入力された音声信号は音声認識装置204で検出文字列を得る。この文字を検出する際にはいくつかの方法があるが、パターン化された信号に対してパターン認識を行い、いくつかの候補の中から最も可能性の高いものを選択するという手法をとるとすると、例えばこのときの候補の数を確からしさの情報とすると、この候補の数が少ない方が確からしさが高いということになる。この数字を検出した文字に付与すれば、確からしさを含んだ音声認識情報である文字列情報20Dを得ることができる(図3を参照)。20Dは第4の特殊文字認識装置205に入力する。ここで、205の動作は202と同一で良いので省略する。205からURL情報を含んだ文字列情報20Eを得る。20Eは第4の文字列候補蓄積装置206に入力される。ここで、206の動作は203と同一で良いので省略する。このように抽出された確からしさを含んだURL情報候補を206に蓄積していく。203および206に蓄積されている情報を207が読み出し、逐次比較を行う。ここで207ではまず、検出文字において両者が完全に一致する場合はそのどちらかを出力する。また、両者が完全に一致しないが一致する文字が多い場合は、例えば一致する文字列はそのまま使用し、一致しない文字列については付与された確からしさデータをもとにどちらの情報を選択するかを決定する。確からしさデータは小さいほど確からしさが大きいので、データが小さいほうを選択するようにする。また、一致する文字が少ない場合は音声の情報がないとして203の出力をそのまま出力する。出力信号20Gは特殊文字記憶装置208に入力され、CPUにより208から別の記憶保持装置などに転送されるなどにより、精度の高いURL情報としてコンテンツ視聴などに利用される。
(Embodiment 2)
This will be described with reference to FIGS. In 201, the input video signal is patterned to obtain a detected character string. There are several ways to detect this character, but pattern recognition is performed on the patterned signal and the most probable method is selected from several candidates. Then, for example, if the number of candidates at this time is used as information on the probability, the smaller the number of candidates, the higher the probability. If this number is added to the detected character,
本発明に係る文字情報取得装置は、映像信号の一部として送信されているURL等の文字列情報を高精度に検出し、コンテンツ視聴などに利用することができるという効果を有し、インターネット情報取得装置を組み込んだインターネット接続機能を有する映像表示装置として有用である。 The character information acquisition apparatus according to the present invention has an effect that character string information such as a URL transmitted as a part of a video signal can be detected with high accuracy and used for content viewing and the like. It is useful as a video display device having an Internet connection function incorporating an acquisition device.
101 文字列検出装置
102、105、202、205 第1の特殊文字認識装置
103、106、203、206 文字列候補蓄積装置
104 音声認識装置
107、207 文字列補正装置
108、208 特殊文字記憶装置
109、209 CPU
201 文字列情報検出装置
204 音声認識情報出力装置
101 Character
201 character string
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004034673A JP2005227944A (en) | 2004-02-12 | 2004-02-12 | Character information acquisition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004034673A JP2005227944A (en) | 2004-02-12 | 2004-02-12 | Character information acquisition device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005227944A true JP2005227944A (en) | 2005-08-25 |
Family
ID=35002626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004034673A Pending JP2005227944A (en) | 2004-02-12 | 2004-02-12 | Character information acquisition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005227944A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014120032A (en) * | 2012-12-18 | 2014-06-30 | Fujitsu Ltd | Character recognition device, character recognition method and character recognition program |
KR101440887B1 (en) * | 2011-12-23 | 2014-09-18 | 주식회사 케이티 | Method and apparatus of recognizing business card using image and voice information |
CN111145783A (en) * | 2019-12-29 | 2020-05-12 | 杭州联汇科技股份有限公司 | Audio signal character string matching method |
-
2004
- 2004-02-12 JP JP2004034673A patent/JP2005227944A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101440887B1 (en) * | 2011-12-23 | 2014-09-18 | 주식회사 케이티 | Method and apparatus of recognizing business card using image and voice information |
JP2014120032A (en) * | 2012-12-18 | 2014-06-30 | Fujitsu Ltd | Character recognition device, character recognition method and character recognition program |
CN111145783A (en) * | 2019-12-29 | 2020-05-12 | 杭州联汇科技股份有限公司 | Audio signal character string matching method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11636146B2 (en) | Content analysis to enhance voice search | |
US10366169B2 (en) | Real-time natural language processing of datastreams | |
US20210067578A1 (en) | Streaming media segments | |
JP6603754B2 (en) | Information processing device | |
EP2978232A1 (en) | Method and device for adjusting playback progress of video file | |
JP2004152063A (en) | Structuring method, structuring device and structuring program of multimedia contents, and providing method thereof | |
KR101992475B1 (en) | Using an audio stream to identify metadata associated with a currently playing television program | |
US20100104177A1 (en) | Information processing apparatus, information processing method and information processing program | |
CN104618807B (en) | Multi-medium play method, apparatus and system | |
WO2017092357A1 (en) | Method and system for creating hyperlink in video playing page, and server | |
JP2010527051A (en) | Document processing for mobile devices | |
KR20140112360A (en) | Vocabulary integration system and method of vocabulary integration in speech recognition | |
US20170300293A1 (en) | Voice synthesizer for digital magazine playback | |
US20130159275A1 (en) | Information searching system and method | |
CN104090887A (en) | Music search method and device | |
CN110692040A (en) | Activating remote devices in a network system | |
CN102541836B (en) | A kind of method and device adjusting format file layout | |
US20190095529A1 (en) | Method and apparatus for generating title and keyframe of video | |
WO2016071716A1 (en) | A video signal caption system and method for advertising | |
JP4157418B2 (en) | Data browsing support device, data browsing method, and data browsing program | |
JP2005227944A (en) | Character information acquisition device | |
EP2458515A1 (en) | Method and apparatus for searching contents in a communication system | |
JP6433045B2 (en) | Keyword extraction apparatus and program | |
US20170070589A1 (en) | Information processing device and recording medium | |
JPWO2014171046A1 (en) | Video receiving apparatus and information display control method in video receiving apparatus |