JP4907635B2 - Method, system and computer readable recording medium for extracting text based on the characteristics of a web page - Google Patents
Method, system and computer readable recording medium for extracting text based on the characteristics of a web page Download PDFInfo
- Publication number
- JP4907635B2 JP4907635B2 JP2008295183A JP2008295183A JP4907635B2 JP 4907635 B2 JP4907635 B2 JP 4907635B2 JP 2008295183 A JP2008295183 A JP 2008295183A JP 2008295183 A JP2008295183 A JP 2008295183A JP 4907635 B2 JP4907635 B2 JP 4907635B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- web page
- extraction range
- pointer
- text extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000000605 extraction Methods 0.000 claims description 240
- 239000000284 extract Substances 0.000 claims description 14
- 238000012790 confirmation Methods 0.000 claims description 12
- 238000013519 translation Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、ウェブページの特性に基づいてテキストを抽出する方法、システム及びコンピュータ読み取り可能な記録媒体に関するものである。より詳細には、本発明は、ウェブページ内のテキストを抽出した後、これを用いて音声変換や翻訳などのテキストに基づいたサービスを提供する際に、ウェブページの特性に応じて、単語、文章、段落及び全文など、相違する範囲のテキストを抽出する方法、システム及びコンピュータ読み取り可能な記録媒体に関するものである。 The present invention relates to a method and system for extracting text based on the characteristics of a web page, and a computer-readable recording medium. More specifically, the present invention extracts a text in a web page, and then uses this to provide a service based on text, such as speech conversion and translation, according to the characteristics of the web page, The present invention relates to a method, a system, and a computer-readable recording medium for extracting different ranges of text such as sentences, paragraphs, and full sentences.
最近、インターネットの使用が普遍化することによって、インターネットを通じた多様な情報の取得が可能になっている。ウェブサイトを通じてインターネットサービスを提供する業者は、より一層多様になっていくユーザーのニーズを充足させるために多様なサービスを提供しており、そのようなサービスの種類も増加している一方である。 Recently, the use of the Internet has become universal, and various information can be acquired through the Internet. Businesses that provide Internet services through websites offer a variety of services to meet the needs of the increasingly diverse users, and the types of such services are increasing.
インターネットユーザーは、このような業者が提供しているサービスに多様な形態で接している。特に、ウェブサイトを通じて、ニュース情報、辞書情報、全文情報、地域情報、ショッピング情報などの多様なインターネットコンテンツを得ようとする。 Internet users interact with the services provided by such vendors in various ways. In particular, various Internet contents such as news information, dictionary information, full-text information, regional information, and shopping information are obtained through a website.
このようなユーザーは、自分自身が希望するコンテンツを取得するためにウェブサイトを通じて検索を遂行し、これを通じて特定のウェブページから希望するコンテンツを取得する場合には、主にテキストから構成された当該コンテンツを肉眼で解読することが一般的である。しかしながら、ユーザーの立場では、このようにテキスト中心に提供されているコンテンツだけを利用することは、マルチメディア時代と呼ばれる最近においてはあまり好ましくないことである。現実的には、ウェブページに含まれている情報の量がますます多くなることにつれて、ユーザーは、テキストの形態で提供されたコンテンツを解読するために肉眼でそのテキストを読みきるまでにユーザーコンピュータのモニターのような表示手段から目を離してはいけない問題点もある。また、ユーザーの中には、コンテンツを通じて希望する情報を取得しながら他の仕事も遂行しようとするいわゆるマルチタスキングのニーズを持った者もあるが、このようなニーズも満たされ難い側面があった。 When such a user performs a search through a website in order to obtain the content he / she desires, and through this, he / she obtains the desired content from a specific web page, the relevant mainly composed of text It is common to decipher content with the naked eye. However, from the user's point of view, it is not so preferable in recent years called the multimedia era to use only the contents provided in the text center. Realistically, as the amount of information contained in a web page increases, users must read the text with their naked eyes to decipher the content provided in the form of text. There is also a problem that you must keep an eye on the display means such as monitors. Some users have the so-called multitasking needs to perform other tasks while obtaining the desired information through the content. However, there are aspects where such needs are difficult to be met. It was.
一方、最近、VoIP(Voice over Internet Protocol)技術、音声認識技術、音声変換技術、音声合成技術、自動応答システムなどのCTI(Computer Telephony Integration)技術が多くの関心を引いていることもやはり事実であり、このような技術におけるインターネット環境でもユーザーが音声で指示を与え、音声で情報の提供を受け、音声で意思を疎通する一歩進んだインターネットサービスを享有することができる。 On the other hand, recently, it is also true that CTI (Computer Telephony Integration) technologies such as VoIP (Voice over Internet Protocol) technology, speech recognition technology, speech conversion technology, speech synthesis technology, and automatic response system have attracted much interest. In addition, even in the Internet environment in such a technology, it is possible to enjoy an advanced Internet service in which a user gives an instruction by voice, receives information by voice, and communicates by voice.
これによって、テキスト中心のコンテンツ提供における問題を解決する一方、CTI技術に幅広く利用するためにTTS(Text To Speech)技術が開発された。TTS技術は、音声認識技術より広く用いられる技術であって、各種テキスト情報を音声に変換して提供するヒューマンインターフェース技術である。ウェブページでのTTS技術は、主にウェブページのテキストを抽出し、これを音声に変換してユーザーに提供する方式で実現する。例えば、ユーザーが、ウェブページの一定の位置で一定の時間の間マウスを停滞させる場合に発生するマウスオーバー(mouse-over)イベント(マウスをオーバーする行為)によってその時のマウスポインタ位置に該当する単語を抽出し、これを音声に変換する場合、又はユーザーがウェブページ上のテキストの一定の部分(領域)をドラッグし(dragging)、これを音声に変換する場合を挙げることができる。 Thus, while solving the problem in providing text-centric contents, TTS (Text To Speech) technology has been developed to be widely used in CTI technology. The TTS technology is a technology that is used more widely than the speech recognition technology, and is a human interface technology that converts various text information into speech and provides it. The TTS technology for web pages is realized mainly by extracting the text of the web page and converting it into speech and providing it to the user. For example, a word corresponding to the current position of the mouse pointer due to a mouse-over event (an action of moving the mouse) that occurs when the user pauses the mouse at a certain position on the web page for a certain period of time. Can be extracted and converted to speech, or the user can drag a certain part (region) of text on a web page and convert it to speech.
しかしながら、現在実現しているウェブページを通じたTTSサービスは、完璧なヒューマンインターフェース技術とはいえない。具体的には、現在のTTSサービスは、ユーザーのマウスオーバー操作により認識された位置の単語だけを音声に変換したり、ユーザーが自らマウスをドラッグして音声変換を希望するだけのテキストを指定するしかない問題があった。前者の場合には、ユーザーの意思とは異なり一律的にマウスオーバーした単語だけが音声に変換される問題があった。そして、後者の場合には、ユーザーが希望する範囲のテキストを音声に変換させるためにはユーザーが概略的ながら肉眼でテキストを解読した後、音声変換の対象になるテキストの範囲を指定しなければならないため、ユーザーが自らテキストを解読せざるを得ない場合をできるだけ排除しようとするTTS技術の本旨から外れることになり、さらにこのようなテキストを指定する行為は、追加的に時間が掛かる問題があった。 However, the currently realized TTS service through a web page is not a perfect human interface technology. Specifically, the current TTS service converts only the word at the position recognized by the user's mouse-over operation into speech, or specifies text that the user wants to convert by dragging the mouse. There was only a problem. In the former case, unlike the user's intention, there is a problem that only the word over which the mouse is uniformly over is converted into speech. In the latter case, in order to convert the text in the range desired by the user into speech, the user must roughly decode the text with the naked eye and then specify the range of text to be converted into speech. As a result, it will be out of the spirit of the TTS technology that tries to eliminate as much as possible the case where the user is forced to decipher the text. Furthermore, the act of specifying such text is an additional time-consuming problem. there were.
したがって、ユーザーの意思に合せて、ウェブページの特性に応じて特定の範囲(例えば、単語、文章、段落又は全文の範囲)のテキストを抽出し、各種テキスト基盤のサービスを提供することによって、ユーザーの便利さ(利便性)を増大させるためのアプローチが必要である。
本発明は、ウェブページの特性に基づいて能動的にテキストを抽出することにその目的がある。 An object of the present invention is to actively extract text based on characteristics of a web page.
また、本発明の他の目的は、ウェブページの特性に基づいて、相違する範囲のテキストを能動的に抽出することによって、ウェブページのユーザーが当該テキストから変換したデータを便利に取得できるようにすることにある。 Another object of the present invention is to enable the user of a web page to conveniently acquire data converted from the text by actively extracting different ranges of text based on the characteristics of the web page. There is to do.
また、本発明のさらに他の目的は、ユーザーがウェブページ上で広い範囲のテキストを抽出しようとする場合、いちいちマウスをドラッグしなければならない不便さを減少させ、ウェブページの特性に基づいて必要とされる広い範囲のテキストを自動的に抽出することによって、ユーザーの不要な操作を減少させることにある。 Yet another object of the present invention is to reduce the inconvenience of having to drag the mouse each time when the user tries to extract a wide range of text on the web page, and based on the characteristics of the web page By automatically extracting a wide range of text, the unnecessary operation of the user is reduced.
また、本発明のさらに他の目的は前述の方法を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することにある。 Still another object of the present invention is to provide a computer-readable recording medium in which a program for executing the above-described method is recorded.
このような目的を達成するための本発明の代表的な構成は次の通りである。 A typical configuration of the present invention for achieving such an object is as follows.
本発明の一態様において、ウェブページの特性に基づいてテキストを抽出する方法であって、ウェブページ上のテキストポインタを認識する段階、前記ウェブページの識別子の少なくとも一部に対応して格納されているテキスト抽出範囲に関する情報を確認する段階、前記テキストポインタ情報及び前記確認されたテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定する段階、及び前記決定された範囲のテキストを抽出する段階を含む方法が提供される。 In one aspect of the present invention, a method of extracting text based on characteristics of a web page, the step of recognizing a text pointer on the web page, stored corresponding to at least a portion of the identifier of the web page Confirming information relating to a text extraction range, determining a text extraction range based on the text pointer information and the information relating to the confirmed text extraction range, and extracting text in the determined range A method is provided.
本発明の他の態様において、ウェブページの特性に基づいてテキストを抽出する方法であって、ウェブページ上のテキストポインタを認識する段階、テキスト抽出情報データベースに前記ウェブページの識別子の少なくとも一部に対応するテキスト抽出範囲に関する情報が格納されているか否かを確認する段階、前記テキスト抽出情報データベースに前記テキスト抽出範囲に関する情報が格納されていないと確認される場合に、前記テキスト抽出範囲に関する情報を受信する段階、前記テキストポインタ情報及び前記受信したテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定する段階、及び前記決定された範囲のテキストを抽出する段階を含む方法が提供される。 In another aspect of the present invention, there is provided a method of extracting text based on characteristics of a web page, the step of recognizing a text pointer on the web page, and at least part of the identifier of the web page in a text extraction information database Confirming whether or not the information about the corresponding text extraction range is stored; if it is confirmed that the information about the text extraction range is not stored in the text extraction information database; A method is provided that includes receiving, determining a text extraction range based on the text pointer information and information about the received text extraction range, and extracting text in the determined range.
本発明のさらに他の態様において、テキストを音声に変換する方法であって、前述したテキスト抽出方法によって抽出されたテキストと関連した音声データを生成する段階をさらに含む方法が提供される。 In yet another aspect of the present invention, there is provided a method for converting text to speech, further comprising generating speech data associated with the text extracted by the text extraction method described above.
本発明のさらに他の態様において、ウェブページの特性に基づいてテキストを抽出するシステムであって、ウェブページ上のテキストポインタを認識するテキストポインタ認識部、前記ウェブページの識別子の少なくとも一部に対応して格納されているテキスト抽出範囲に関する情報を確認するテキスト抽出範囲情報確認部、前記テキストポインタ情報及び前記確認されたテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定するテキスト抽出範囲決定部、及び前記決定された範囲のテキストを抽出するテキスト抽出部を含むシステムが提供される。 In yet another aspect of the present invention, a system for extracting text based on the characteristics of a web page, the text pointer recognition unit for recognizing a text pointer on the web page, corresponding to at least part of the identifier of the web page A text extraction range information confirmation unit for confirming information on the text extraction range stored as a text extraction range determination unit for determining a text extraction range based on the text pointer information and the information on the confirmed text extraction range; And a text extraction unit for extracting the determined range of text.
本発明のさらに他の態様において、ウェブページの特性に基づいてテキストを抽出するシステムであって、テキスト抽出情報データベース、ウェブページ上のテキストポインタを認識するテキストポインタ認識部、前記テキスト抽出情報データベースに前記ウェブページの識別子の少なくとも一部に対応するテキスト抽出範囲に関する情報が格納されているか否かを確認し、そうでない場合、テキスト抽出範囲に関する情報を受信するテキスト抽出範囲情報受信部、前記テキストポインタ情報及び前記受信したテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定するテキスト抽出範囲決定部、及び前記決定された範囲のテキストを抽出するテキスト抽出部を含むシステムが提供される。 In yet another aspect of the present invention, a system for extracting text based on the characteristics of a web page includes a text extraction information database, a text pointer recognition unit for recognizing a text pointer on a web page, and the text extraction information database. A text extraction range information receiving unit for confirming whether or not information about a text extraction range corresponding to at least a part of the identifier of the web page is stored; A system is provided that includes a text extraction range determination unit that determines a text extraction range based on information and information about the received text extraction range, and a text extraction unit that extracts text in the determined range.
本発明のさらに他の態様において、テキストを音声に変換するシステムであって、ウェブページ上のテキストポインタを認識するテキストポインタ認識部、前記ウェブページの識別子の少なくとも一部に対応して格納されているテキスト抽出範囲に関する情報を確認するテキスト抽出範囲情報確認部、前記テキストポインタ情報及び前記確認したテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定するテキスト抽出範囲決定部、前記決定された範囲のテキストを抽出するテキスト抽出部、及び前記抽出されたテキストと関連した音声データを生成する音声データ生成部を含むシステムが提供される。 In still another aspect of the present invention, there is provided a system for converting text into speech, a text pointer recognition unit for recognizing a text pointer on a web page, stored corresponding to at least a part of the identifier of the web page. A text extraction range information confirmation unit for confirming information on the text extraction range, a text extraction range determination unit for determining a text extraction range based on the text pointer information and the information on the confirmed text extraction range, A system is provided that includes a text extraction unit that extracts text, and an audio data generation unit that generates audio data associated with the extracted text.
本発明のさらに他の態様において、テキストを音声に変換するシステムであって、テキスト抽出情報データベース、ウェブページ上のテキストポインタを認識するテキストポインタ認識部、前記テキスト抽出情報データベースに前記ウェブページの識別子の少なくとも一部に対応するテキスト抽出範囲に関する情報が格納されているか否かを確認し、そうでない場合、前記テキスト抽出範囲に関する情報を受信するテキスト抽出範囲情報受信部、前記テキストポインタ情報及び前記受信したテキスト抽出範囲に関する情報に基づいてテキスト抽出範囲を決定するテキスト抽出範囲決定部、前記決定された範囲のテキストを抽出するテキスト抽出部、及び前記抽出されたテキストと関連した音声データを生成する音声データ生成部を含むシステムが提供される。 In still another aspect of the present invention, there is provided a system for converting text into speech, a text extraction information database, a text pointer recognition unit for recognizing a text pointer on a web page, and an identifier of the web page in the text extraction information database. A text extraction range information receiving unit for receiving information on the text extraction range, the text pointer information, and the reception A text extraction range determination unit that determines a text extraction range based on information about the extracted text extraction range, a text extraction unit that extracts text in the determined range, and a voice that generates voice data associated with the extracted text System including data generator There is provided.
この以外にも、本発明において、ウェブページの特性に基づいてテキストを抽出するための他の方法、システム、及びこの方法を実行するためのコンピュータプログラムを記録するコンピュータ読み取り可能な記録媒体がさらに提供される。 In addition to this, the present invention further provides another method and system for extracting text based on the characteristics of a web page, and a computer-readable recording medium for recording a computer program for executing the method. Is done.
本発明において、ウェブページの特性に基づいてテキストが能動的に抽出され、音声変換サービス又は翻訳サービスのようなテキスト基盤のサービスが提供されるので、ユーザーの多くの操作がなくてもユーザーの意思に符合するテキスト基盤のデータを取得することができる。 In the present invention, text is actively extracted based on the characteristics of a web page, and a text-based service such as a speech conversion service or a translation service is provided. Text-based data that matches can be obtained.
また、本発明において、ユーザーがウェブページの特性を詳細に知らずにウェブページにアクセスする場合にも、その特性に合う範囲のテキストが自動的に抽出されるようにすることによって、ユーザーがウェブページに表示されたコンテンツを効率的に把握することができる。 Further, in the present invention, even when the user accesses the web page without knowing the characteristics of the web page in detail, the user can automatically extract the text within the range that matches the characteristics of the web page. It is possible to efficiently grasp the content displayed on the screen.
一方、本発明において、ユーザーがウェブページ上で広い範囲のテキストを抽出しようとする場合、ユーザーがこれを全てドラッグしなければならない不便さをなくすことができ、マウスドラッグのエラーによるテキスト抽出のエラーも防止することができる。 On the other hand, in the present invention, when a user tries to extract a wide range of text on a web page, the inconvenience of the user having to drag all of the text can be eliminated, and the text extraction error due to the mouse drag error can be eliminated. Can also be prevented.
以下、本発明を実施できる特定実施形態を例示として示す添付図面を参照して本発明について詳細に説明する。後述するこれらの実施形態は当業者が本発明を十分に実施できるように詳細に説明する。本発明の多様な実施形態は互いに異なるが、相互排他的である必要はないと理解しなければならない。例えば、ここに記載されている特定形状、構造及び特性は一実施形態に関連して本発明の技術的思想及びその範囲から逸脱せずに他の実施形態として具現することができる。また、ここに開示したそれぞれの実施形態のうち、個別構成要素の位置または配置は、本発明の技術的思想及びその範囲から逸脱せずに変更できることを理解するべきである。したがって、後述する詳細な説明は限定的な意味で扱うものでなく、本発明の技術的範囲は、適切に説明されるならば、その請求項に記載された本発明と均等な全ての技術的範囲と共に添付した特許請求範囲によって定められる。 The present invention will now be described in detail with reference to the accompanying drawings which illustrate, by way of example, specific embodiments in which the invention may be practiced. These embodiments described below are described in detail so that those skilled in the art can fully practice the present invention. It should be understood that the various embodiments of the present invention are different from each other but need not be mutually exclusive. For example, the specific shapes, structures, and characteristics described herein may be embodied in other embodiments without departing from the spirit and scope of the invention in connection with one embodiment. In addition, it should be understood that the position or arrangement of individual components in each of the embodiments disclosed herein can be changed without departing from the technical idea and scope of the present invention. The following detailed description is, therefore, not to be construed in a limiting sense, and the technical scope of the present invention is equivalent to all technical equivalents of the present invention described in the claims if properly described. It is defined by the scope of the appended claims along with the scope.
全体システムの構成
図1は、本発明の一実施形態に係るテキスト抽出システムの概略的な構成を示した図面である。
Configuration of Overall System FIG. 1 is a diagram showing a schematic configuration of a text extraction system according to an embodiment of the present invention.
図1に示すように、本発明の一実施形態に係るテキスト抽出システムは、ユーザーコンピュータ100及びTTSサーバー300を含むことができる。ここで、ユーザーコンピュータ100とTTSサーバー300は、専用回線を利用する近距離通信網(LAN)または遠距離通信網(WAN)などの多様なネットワーク環境を通じて通信することができる。このようなネットワーク環境は公知のワールドワイドウェブ(World Wide Web、WWW)である。一方、TTSサーバー300は、公知のネットワーク環境でインターネットプロトコルを通じて一つ以上のユーザーコンピュータ100と双方向に通信することができる。また、このようなTTSサーバー300は、ユーザーコンピュータ100からの要請に応じて、最新抽出範囲情報データベース500及び音声変換データベース700を参照して処理することができる。
As shown in FIG. 1, the text extraction system according to an embodiment of the present invention may include a
ユーザーコンピュータ100は、例えばパーソナルコンピュータ、携帯電話、PDA等の通信端末装置から構成され、ユーザーコンピュータ100における各種処理結果を画面表示するための表示装置、端末使用者の操作入力を受け付けるためのキーボード、マウス、タッチパネル等の操作入力部、音声出力を行うためのスピーカー等を備えている。また、ユーザーコンピュータ100は、インターネットやLAN等の通信網を介して通信部190と通信可能に接続されている。
The
ユーザーコンピュータの構成
図2Aは、図1に示すテキスト抽出システムのうち、ユーザーコンピュータ100の詳細構成を示す図面であり、図2Bは、TTSサーバー300の詳細構成を示す図面である。
Configuration of User Computer FIG. 2A is a diagram illustrating a detailed configuration of the
図2Aに示すように、ユーザーコンピュータ100は、演算部110、テキスト抽出範囲情報データベース130、プログラム格納部150、ユーザー入力部170、出力部180及び通信部190を含むことができる。
As shown in FIG. 2A, the
演算部110は、マウスオーバー認識部111、抽出範囲情報確認部112、抽出範囲情報要請部113、最新抽出範囲情報要請部115、抽出方式決定部117、テキスト抽出部118、及び音声データ提供部119を含むことができる。本発明の一実施形態によれば、マウスオーバー認識部111、抽出範囲情報確認部112、抽出範囲情報要請部113、最新抽出範囲情報要請部115、抽出方式決定部117、テキスト抽出部118及び音声データ提供部119は、そのうち少なくとも一部が演算部110に含まれることができ、物理的には様々な公知の記憶装置上に格納されることができる。また、このようなプログラムモジュールは、演算部110と通信可能な遠隔の記憶装置に格納されることもできる。このようなプログラムモジュールは、本発明によって後述する特定業務を遂行したり、特定抽象データ類型を実行したりするルーチン、サブルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを包括するが、本発明はこれに制限されるものではない。
The
一方、演算部110は、必要によってURL(Uniform Resource Locator)のようなウェブページの識別子に対応して格納されている、ウェブページ内のテキストの抽出範囲に関する情報(例えば、ウェブページの特性によって単位、文章、段落及び全文のうち、どの範囲のテキストを抽出するかに関する情報)を格納しているテキスト抽出範囲情報データベース130を参照することができ、このテキスト抽出範囲情報データベース130は、演算部110内に一つの構成要素として含まれることができる。
On the other hand, the
また、演算部110は、プログラム駆動部(不図示)をさらに含んで、プログラム格納部150に格納されているプログラム、すなわち、本発明におけるテキストを抽出したり、抽出されたテキストを用いてテキスト基盤のサービスを提供するためのプログラムが、ユーザーのウェブブラウザーが実行される際に共に駆動されるようにすることができる。プログラム格納部150は、必ずしもユーザーコンピュータ100の一つの構成要素として含まれる必要はなく、コンピュータで読み取り可能な公知の記録媒体、すなわち、ハードディスク、フロッピーディスク、フロプティカルディスク、磁気テープ、CD−ROM、DVDなどの記録媒体に代替することができる。
The
ユーザー入力部170は、通常のコンピュータ入力手段、すなわち、キーボードやマウスなどでもよく、出力部180は、ウェブブラウザーの表示及び/又はウェブページの表示を視覚的に示すためのコンピュータモニターやテキストを音声で出力するスピーカーなどで実現することができる。
The
サーバーの構成
一方、図2Bに示すTTSサーバー300は、TTSサービス、すなわち、ウェブページ内の少なくとも一部のテキストを音声に変換し、これをユーザーに提供するためのサーバーである。このようなTTSサーバー300は、インターネットポータルサイトのウェブサーバーでもよく、TTSサービスだけを専門的に提供する業者の運営サーバーでもよい。また、本発明の他の実施形態におけるTTSサーバー300は、TTSサービスと直接的に関連付けられていない一般的なウェブサーバーに置換することができる。
Server Configuration Meanwhile, the
本発明の一実施形態に係るTTSサーバー300は、最新抽出範囲情報判断部310、最新抽出範囲情報取得部330及びTTS変換部370を含む。本発明の一実施形態によれば、最新抽出範囲情報判断部310、最新抽出範囲情報取得部330及びTTS変換部370は、そのうち少なくとも一部がTTSサーバー300に含まれることができ、TTSサーバー300と通信するプログラムモジュールであることもできる。このようなプログラムモジュールは、運営システム、応用プログラムモジュール及びその他プログラムモジュールの形態でTTSサーバー300に含まれることができ、物理的には様々な公知の記憶装置上に格納されることができる。また、このようなプログラムモジュールは、TTSサーバー300と通信可能な遠隔の記憶装置に格納されることもできる。このようなプログラムモジュールは、本発明によって後述する特定業務を遂行したり、特定抽象データ類型を実行したりするルーチン、サブルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを包括するが、本発明はこれに制限されるものではない。
The
参考に、図1及び図2に示した各構成要素は、互いに必要によって信号を送受信することができるものと理解するべきであるが、本発明を実現するのに必要である、前述した信号交換のための公知の通信手段については、具体的な説明を省略する。 For reference, it should be understood that the components shown in FIGS. 1 and 2 can transmit and receive signals to and from each other as necessary, but the signal exchange described above is necessary to realize the present invention. A detailed description of known communication means for the above will be omitted.
テキストの抽出及び音声変換
図3は、本発明の一実施形態においてテキストを抽出し、抽出されたテキストを音声に変換する過程を示すフローチャートである。以下では、図2A及び図2Bと共に図3を参照して、本発明の一実施形態におけるウェブページ内のテキストを抽出する過程と抽出されたテキストを音声変換して出力する過程について詳細に説明する。
Text Extraction and Speech Conversion FIG. 3 is a flowchart illustrating a process of extracting text and converting the extracted text into speech in an embodiment of the present invention. Hereinafter, with reference to FIGS. 2A and 2B and FIG. 3, a process of extracting text in a web page and a process of outputting the extracted text by voice conversion according to an embodiment of the present invention will be described in detail. .
ユーザーが、ユーザーコンピュータ100を用いてウェブブラウザーを実行させる場合には、本発明の一実施形態においてテキストを抽出し、抽出されたテキストを音声に変換して出力するためのプログラムが共に駆動される。このプログラムは、前述したようにユーザーコンピュータ100の内部に含まれるプログラム格納部150に記録されることもでき、別の記録媒体に記録されることもできる。
When a user uses a
以後、ユーザーは、インターネットに接続でき、ウェブブラウザーを通じて所定のURLを有するウェブページにアクセスすることができる。一方、数多くのサーバーがウェブブラウザーを通じてアクセス可能なコンテンツを提供するが、これらのアドレスを表示するために通常はURLを用いる。このようなURLは、インターネット上の各サーバーにあるファイルのアドレスを明示するためのものであるが、URLは、比較的自由に決まる属性があるので、ウェブページの特性を示すための他の情報(例えば、本発明の一実施形態に係るテキスト抽出範囲に関する情報)もやはり含むことができる。いずれの場合においても、URLまたはURLの一部は、本発明に係るテキスト抽出範囲に関する情報と対応することができる。 Thereafter, the user can connect to the Internet and access a web page having a predetermined URL through a web browser. On the other hand, many servers provide content accessible through a web browser, but URLs are usually used to display these addresses. Such a URL is for specifying the address of a file in each server on the Internet. However, since the URL has an attribute that is determined relatively freely, other information for indicating the characteristics of the web page is used. (For example, information regarding a text extraction range according to an embodiment of the present invention) may also be included. In any case, the URL or a part of the URL can correspond to the information regarding the text extraction range according to the present invention.
図3の例では、本発明の一実施形態におけるウェブページからテキストを抽出し、これを音声変換したデータを出力する過程について説明する。 In the example of FIG. 3, a process of extracting text from a web page and outputting data obtained by voice conversion of the text in one embodiment of the present invention will be described.
まず、ユーザーが、ユーザーコンピュータ100のウェブブラウザーにより表示される、ウェブページに含まれたテキスト上にマウスポインタを位置させると、段階S310で、演算部110のマウスオーバー認識部111は、マウスオーバーイベントが発生したか否かを把握(判別)する。
First, when the user positions the mouse pointer on the text included in the web page displayed by the web browser of the
段階S330では、抽出範囲情報確認部112が、現在のウェブページのURLに対応して格納されているテキスト抽出範囲に関する情報がテキスト抽出範囲情報データベース130に存在するか否かを判断する。簡略に前述したように、テキスト抽出範囲情報データベース130には、ウェブページのURLに対応してテキスト抽出範囲に関する情報が格納される。このようなテキスト抽出範囲に関する情報は、URL別にそれぞれ格納されることができ、当該ウェブページのいくつかの類型別に分けて集合的に格納されることもできる。これについては、以下でより詳細に説明する。
In step S330, the extraction range
段階S330において、抽出範囲情報確認部112により現在のウェブページのURLに対応するテキスト抽出範囲に関する情報が、テキスト抽出範囲情報データベース130に存在しないと判断される場合には、段階S331では、抽出範囲情報要請部113が、現在のウェブページのURLに該当するテキスト抽出範囲に関する情報をTTSサーバー300に要請する。本発明の一実施形態によれば、TTSサーバー300が参照する最新抽出範囲情報データベース500は、TTSサービスを提供するために必要とされる多様な情報、すなわち、各URLのテキスト抽出範囲に関する情報及びURL別に提供しているウェブページの類型に関する情報を周期的にアップデートしてテキスト抽出範囲に関する最新の情報を格納する。抽出範囲情報要請部113が、現在のウェブページのURLに該当するテキスト抽出範囲に関する情報を要請する場合には、TTSサーバー300の最新抽出範囲情報取得部330は、最新抽出範囲情報データベース500を参照して該当のURLに対応する最新の情報をユーザーコンピュータ100の演算部110に伝送する。
In step S330, when the extraction range
段階S330において、抽出範囲情報確認部112により当該URLに対応するテキスト抽出範囲に関する情報がテキスト抽出範囲情報データベース130に存在すると判断される場合には、段階S333で、演算部110の最新抽出範囲情報要請部115は、テキスト抽出範囲情報データベース130に存在する情報が最新の情報であるか否かを判断した後、最新の情報ではない場合には、TTSサーバー300から最新の情報の提供を受けるための要請を当該TTSサーバー300に伝送する。TTSサーバー300の最新抽出範囲情報判断部310は、最新抽出範囲情報要請部115の要請に応答して最新抽出範囲情報データベース500に格納されている情報を参照してテキスト抽出範囲情報データベース130に存在する情報が最新の情報であるか否かを判断する。このとき、例えば、当該情報が最新の情報であれば、これに対応する所定の信号をユーザーコンピュータ100に伝送する。一方、例えば、当該情報が最新の情報でない場合は、最新抽出範囲情報取得部330は、最新抽出範囲情報データベース500に格納されている最新のテキスト抽出範囲情報を抽出してユーザーコンピュータ100の演算部110に伝送することができる。
In step S330, if the extraction range
段階S340では、演算部110は、段階S331または段階S333で発した要請に応答してTTSサーバー300が伝送してきたテキスト抽出範囲に関する情報を受信する。すなわち、演算部110は、現在ウェブブラウザーに表示されているウェブページのテキストのうち、マウスオーバーした位置にある単語だけを抽出するか、文章または段落を抽出するか、または当該ウェブページに含まれるテキスト全文を抽出するかに関する情報を受信する。TTSサーバー300により参照される最新抽出範囲情報データベース500には、URL別にテキスト抽出範囲に関する最新の情報がアップデートされて格納されているため、段階S340で、TTSサーバー300から受信したテキスト抽出範囲に関する情報は、常に最新の情報である。
In step S340, the
また、演算部110は、TTSサーバー300から受信したテキスト抽出範囲に関する最新情報をテキスト抽出範囲情報データベース130に格納する。現在のウェブページのテキスト抽出範囲に関する情報がテキスト抽出範囲情報データベース130に存在するが、TTSサーバー300によりその情報が最新の情報でないと判断される場合には、テキスト抽出範囲情報データベース130に格納されている情報がTTSサーバー300により伝送された最新の情報にアップデートされ、そうでない場合には、このようなアップデートは省略されることができる。一方、段階S330での判断結果が「いいえ」の場合には、受信した最新のテキスト抽出範囲情報は、テキスト抽出範囲情報データベース130に新規で格納される。
In addition, the
段階S350では、TTSサーバー300から受信したテキスト抽出範囲情報またはテキスト抽出範囲情報データベース130に格納されていた最新のテキスト抽出範囲に関する情報に基づいて、単語、文章、段落または全文を抽出することにおいて、必要な抽出方式を決定することができる。本発明に係るテキスト抽出方式に関する例については、後述する。
In step S350, based on the text extraction range information received from the
段階S360では、先行段階で決定されたテキスト抽出範囲とテキスト抽出方式に基づいてテキストを抽出する。このとき、抽出された範囲のテキストは反転して表示するなどのように、これにより抽出されないその他のテキストとは視覚的に区別されることができる。したがって、ユーザーは、ウェブページのうち、どの部分のテキストを抽出されたかに対して把握することができ、これにより当該ウェブページがどのような特性を有しているかに対しても間接的に確認することができる。さらに、ユーザーは、ウェブページとこれに対応するテキスト抽出の範囲が適切でないと判断される際には、これをユーザーフィードバックとしてTTSサーバー300に提供することができる。
In step S360, text is extracted based on the text extraction range and text extraction method determined in the preceding step. At this time, the extracted range of text can be visually distinguished from other text that is not extracted. Therefore, the user can grasp which part of the text of the web page has been extracted, thereby indirectly checking what characteristics the web page has. can do. Furthermore, when it is determined that the web page and the corresponding text extraction range are not appropriate, the user can provide this to the
段階S370においては、段階S360で抽出されたテキストがTTSサーバー300に伝送される。TTSサーバー300のTTS変換部370は、テキストを音声に変換するために必要である情報を格納している音声変換データベース700を参照して受信したテキストを音声データに変換し、これをさらにユーザーコンピュータ100に伝送することができる。音声変換データベース700には、コード化された各テキスト別に音声データが格納されることもでき、単語別、文章別、または段落別にこれに対応する音声データが格納されることもできる。
In step S370, the text extracted in step S360 is transmitted to the
段階S380においては、TTSサーバー300から伝送される音声データがユーザーコンピュータ100に伝送される。
In step S380, the audio data transmitted from the
段階S390においては、受信した音声データは、演算部110の音声データ提供部119により提供されると共に、当該音声データは、スピーカーなどの出力部180から出力されることができる。
In step S390, the received audio data is provided by the audio data providing unit 119 of the
本明細書においては、本発明の一実施形態においてユーザーコンピュータ100にはTTSサーバー300とは別のテキスト抽出範囲情報データベース130が存在し、基本的にこれに格納されているテキスト抽出範囲情報に基づいてテキストが抽出されるものと説明しているが、このような構成要素を省略したまま、どの範囲のテキストを抽出するかを決定するための参照データベースを最新抽出範囲情報データベース500に一元化することも可能であり、音声変換が例示的に説明されたこととは異なり、TTSサーバー300による音声変換データベース700を参照することのなく、ユーザーコンピュータ100で行われることもやはり可能である点を理解しなければならない。一方、本発明に係る変更例においては、本発明で言及している、いわゆるテキスト抽出は、ユーザーコンピュータ100だけでなく、その代案としてTTSサーバー300でも遂行されることができる点を理解しなければならない。
In the present specification, in one embodiment of the present invention, the
テキスト抽出の範囲に関する情報の活用
本発明の一実施形態によれば、ウェブページの特性に基づいて相違する範囲のテキストを抽出して利用することができる。以下では、テキスト抽出の範囲を差別化するための基準であるウェブページの特性の例について説明する。
Utilization of Information on Text Extraction Range According to an embodiment of the present invention, it is possible to extract and use text in a different range based on the characteristics of a web page. Below, the example of the characteristic of the web page which is a reference | standard for differentiating the range of text extraction is demonstrated.
ユーザーがユーザーコンピュータ100を用いてアクセスするウェブページは、それぞれ固有のURLを有し、またそれぞれのウェブページは、一定の特性を有する。このようなウェブページは、そのコンテンツの属性によってニュース記事ページ、生活情報ページ、ショッピング情報ページ、百科事典ページ、語学辞書ページ、全文情報ページ、ブログページなどのように多様に区分されることができる。万一、あるウェブページに含まれているコンテンツがニュース記事であれば、該当ウェブページを見ているユーザーは、特定の単語または文章に集中するよりは、ニュース記事の全文や所定の段落の内容を把握しようとするはずである。一方、ユーザーが本出願人の著名な知識サービスである「知識iN」コーナーのような全文情報を扱っているウェブページを見る場合には、知識質問とこれに関する答えの内容だけに興味があるはずである。また、百科事典または語学辞書のウェブページを見ているユーザーであれば、特定の単語に関する定義及びこれを説明するための例文だけに興味がある可能性が高い。したがって、ウェブページに含まれているコンテンツの属性や類型によってテキスト基盤のサービスを提供するための基礎になるテキストの抽出範囲は変わらなければならない。すなわち、例えば、ニュース記事が含まれているウェブページに対しては、当該ページ内のテキストを段落または全文単位で抽出したほうが好ましく、辞書ページに対しては、単語及びそれに関連した説明部に該当するテキストだけをまず抽出したほうが好ましいであろう。
Each web page that a user accesses using the
このために、本発明の一実施形態に係るテキスト抽出範囲情報データベース130には、各ウェブページの特性に基づいて相違するテキスト抽出範囲に関する情報が格納されることができる。本発明に係るテキスト抽出範囲情報データベース130では、ウェブページのURLなどがテキスト抽出範囲に関する情報に対応して格納されることができる。
For this reason, the text extraction
必要によって、抽出範囲情報データベース130の情報は、ユーザーのオンライン/オフライン要請により変更または削除されることができる。なお、TTSサービスを提供する業者だけが抽出範囲情報データベース130の情報に対してアクセスする権限を持つのがよい。前述したように、抽出範囲情報データベース130内の情報は、TTSサーバー300との通信により最新の情報にアップデートすることができる。このためには、TTSサーバー300は、抽出範囲情報データベース130を含んで構成されてもよいし、TTSサーバー300と通信する最新抽出範囲情報データベース500を用いて構成されてもよい。
If necessary, information in the extraction
最新抽出範囲に関する情報の取得
本発明の一実施形態における演算部110の抽出範囲情報確認部112によりテキスト抽出範囲に関する情報が存在するか否かを確認し、その結果に基づいてTTSサーバー300から最新抽出範囲に関する情報を取得する過程について詳しく説明する。
Acquisition of information regarding latest extraction range The extraction range
前述したように、抽出範囲情報確認部112は、現在のウェブページに対応するテキスト抽出範囲に関する情報がユーザーコンピュータ100のテキスト抽出範囲情報データベース130に存在するか否かを確認する。
As described above, the extraction range
例えば、テキスト抽出範囲情報データベース130に現在のウェブページのURLに対応するテキスト抽出範囲に関する情報が存在しないと判断される場合には、演算部110の抽出範囲情報要請部113は、TTSサーバー300に対して当該テキスト抽出範囲に関する情報を要請する。
For example, when it is determined that there is no information regarding the text extraction range corresponding to the URL of the current web page in the text extraction
これによって、TTSサーバー300の最新抽出範囲情報取得部330は、最新抽出範囲情報データベース500を参照して抽出範囲情報要請部113から要請されたテキスト抽出範囲に関する情報を取得し、これをユーザーコンピュータ100の演算部110に伝送する。演算部110は、テキスト抽出範囲に関する情報を受信し、これをテキスト抽出範囲情報データベース130に格納すると共に、これに基づいて現在のウェブページのテキストを抽出する。
Accordingly, the latest extraction range
一方、本発明の一実施形態によれば、抽出範囲情報確認部112により現在のウェブページに対応するテキスト抽出範囲に関する情報がテキスト抽出範囲情報データベース130に既に存在すると判断される場合には、演算部110の最新抽出範囲情報要請部115は、TTSサーバー300に該当情報が最新の情報であるか否かの判断を要請することができる。
On the other hand, according to one embodiment of the present invention, if the extraction range
続いて、TTSサーバー300の最新抽出範囲情報判断部310は、最新抽出範囲情報データベース500を参照して現在のテキスト抽出範囲情報データベース130に存在するテキスト抽出範囲に関する情報が最新の情報であるか否かを判断することができる。
Subsequently, the latest extraction range
仮に、テキスト抽出範囲情報データベース130に存在する情報と最新抽出範囲情報データベース500に存在する情報が同一であれば、TTSサーバー300は、ユーザーコンピュータ100の演算部110にテキスト抽出範囲情報データベース130の情報が最新の情報であることを確認する所定の信号を伝送することができる。
If the information existing in the text extraction
また、例えば、テキスト抽出範囲情報データベース130に存在する情報と最新抽出範囲情報データベース500に存在する情報が相違すると判断される場合には、TTSサーバー300は、最新抽出範囲情報データベース500に存在する情報をユーザーコンピュータ100の演算部110に伝送することができる。これによって、演算部110は、テキスト抽出範囲情報データベース130に格納されていた情報を受信した情報に代替することができる。
Further, for example, when it is determined that the information existing in the text extraction
テキストの抽出方式
本発明の一実施形態によれば、ウェブページに含まれるテキストを単語、文章、段落または全文の単位で抽出することにおいて、MSAA(MicorSoft Active Accessibility)の方式やIHTML(Inner HTML)の方式を使用して抽出することができる。本発明の一実施形態によれば、抽出方式に対する決定もやはり必要によってウェブページの特性に基づいて定められる。ここで、MSAAの方式は、通常、多く使用されるInternet Explorer(登録商標)ウェブブラウザーと共に提供される所定の関数を用いてウェブページ内の所定の範囲のテキストを抽出する方式であり、IHTMLの方式は、HTML形式で作成されたウェブページからタグ単位でテキストを抽出する方式(例えば、所定のタグの間のテキストを抽出する方式)である。本発明に係るテキスト抽出方式の決定は、図2Aに示すような抽出方式決定部117によって遂行されることができる。
Text Extraction Method According to an embodiment of the present invention , in extracting text included in a web page in units of words, sentences, paragraphs or whole sentences, MSAA (MicroSoft Active Accessibility) method or IHTML (Inner HTML) is used. This method can be used for extraction. According to an embodiment of the present invention, the decision on the extraction method is also determined based on the characteristics of the web page if necessary. Here, the MSAA method is a method of extracting a predetermined range of text in a web page using a predetermined function provided with a commonly used Internet Explorer (registered trademark) web browser. The method is a method of extracting text in tag units from a web page created in the HTML format (for example, a method of extracting text between predetermined tags). The determination of the text extraction method according to the present invention can be performed by an extraction
例えば、ユーザーが、下記のようなHTMLソースで作成されたウェブページにアクセスしていると仮定してみる。 For example, assume that a user is accessing a web page created with the following HTML source.
<div class='knCnt' style='overflow:hidden;word−wrap:break−word;word−break:break−all;'>
<P>数学は 科学にも密接に関連があり、多くの学問で必要とされる重要な学問であるが</P>
<P>なぜノーベル賞がありませんか?</P>
<P>フィールズ賞に対しても詳細に書いてください</P>
<P>数学系のノーベル賞であると...</P>
</div>
<Div class = 'knCnt' style = 'overflow: hidden; word-wrap: break-word; word-break: break-all;'>
<P> Mathematics is closely related to science and is an important discipline that is needed in many disciplines </ P>
<P> Why is there no Nobel Prize? </ P>
<P> Please write in detail for the Fields Prize </ P>
<P> Mathematical Nobel Prize. . . </ P>
</ Div>
演算部110のマウスオーバー認識部111によりマウスオーバーイベントが「科学にも密接に」のうち、「科」の位置で発生したと認識された場合、MSAAの方式によれば、当該テキスト前後の最も近いタグ(すなわち、例文では<P>と</P>)の間のテキストである「数学は科学にも密接に関連があり、多くの学問で必要とされる重要な学問であるが」との文章が抽出されることができる。一方、IHTMLの方式によれば、<P>とのHTMLタグの単位でテキストを抽出することも可能であるが、すべてのHTML文書を持ってきて、<div>タグに基づいてテキストを抽出することも可能である。このように、<div>タグに基づいてテキストが抽出されるのであれば、テキスト全体が抽出される。
When the mouse over
すなわち、テキスト抽出範囲情報データベース130または最新抽出範囲情報データベース500の情報に基づいてウェブページでマウスオーバーした位置のテキストを抽出する際に、文章単位でテキストを抽出することが好ましい場合には、演算部110の抽出方式決定部117は、MSAAの方式を選ぶことが役に立つ。一方、ウェブページの特性上、段落または全文範囲のテキストを抽出する場合には、所定のHTMLタグに基づいて容易にテキストを抽出することのできるIHTMLの方式を選ぶことが好ましい。
That is, when it is preferable to extract the text in units of sentences when extracting the text at the position where the mouse is over on the web page based on the information in the text extraction
本発明に係る実施形態におけるウェブページの特性に基づいてテキストを抽出するための方法は、コンピュータにより具現される多様な動作を実行するためのプログラム命令により実現でき、また、これらのプログラムを記録したコンピュータ読取可能な記録媒体として提供することも可能である。コンピュータ読取可能な記録媒体としては、プログラム命令、データファイル、データ構造などを単独または組合せて含むことができる。この媒体に記録されるプログラム命令は本発明のために特別に設計され構成されたものでもよく、コンピュータソフトウェアの当業者に公知され使用できるものでもよい。コンピュータ読取可能な記録媒体の例は、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media)、CD−ROM、DVDのような光記録媒体(optical media)、フロップティーカールディスク(Floptical disk)のような磁気−光媒体(magneto−optical media)、及びリードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、フラッシュメモリなどのようなプログラム命令を格納して行うように特別に構成されたハードウェア装置を含む。プログラム命令の例には、コンパイラーにより作られるような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行されることのできる高級言語コードが含まれる。前述したハードウェア装置は本発明の動作を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができ、その逆も同様である。 The method for extracting text based on the characteristics of the web page in the embodiment according to the present invention can be realized by program instructions for executing various operations embodied by a computer, and the programs are recorded. It can also be provided as a computer-readable recording medium. The computer-readable recording medium can include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on this medium may be specially designed and configured for the present invention or may be known and usable by those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and flop tea curls. Specially designed to store and execute program instructions such as magnetic-optical media such as a disk (floppy disk), read only memory (ROM), random access memory (RAM), flash memory, etc. The hardware device comprised in is included. Examples of program instructions include not only machine language code as produced by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above can be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
以上のように、本発明では具体的な構成要素などのような特定事項と限定された実施形態及び図面により説明したが、これは本発明のより全体的な理解を助けるために提供されたものであり、本発明は前述の実施形態に限定されるものではなく、本発明が属する分野で通常的な知識を持った者であれば、このような記載から多様な修正及び変形が可能であるはずである。 As described above, the present invention has been described with reference to specific items such as specific components and limited embodiments and drawings, which are provided to assist in a more comprehensive understanding of the present invention. The present invention is not limited to the above-described embodiment, and various modifications and variations can be made from such description as long as the person has ordinary knowledge in the field to which the present invention belongs. It should be.
以上、本発明の詳細な説明では具体的な実施形態について説明したが、本発明の要旨から逸脱しない範囲内で多様に変形できる。よって、本発明の権利範囲は、上述の実施形態に限定されるものではなく、特許請求の範囲の記載及びこれと均等なものに基づいて定められるべきである。 As mentioned above, although specific embodiment was described in detailed description of this invention, it can change variously within the range which does not deviate from the summary of this invention. Therefore, the scope of rights of the present invention should not be limited to the above-described embodiment, but should be determined based on the description of the scope of claims and equivalents thereof.
100 ユーザーコンピュータ
110 演算部
130 テキスト抽出範囲情報データベース
150 プログラム格納部
170 ユーザー入力部
180 出力部
300 TTSサーバー
500 最新抽出範囲情報データベース
700 音声変換データベース
DESCRIPTION OF
Claims (22)
ウェブページ上のテキストポインタを認識する段階と、
前記ウェブページの識別子の少なくとも一部に対応して格納されている、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報の中から、前記テキストポインタが認識された前記ウェブページに対する前記テキスト抽出範囲情報を識別する段階と、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記識別されたテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定する段階と、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出する段階と、
を含む方法。 A method for extracting text based on characteristics of a web page, the steps performed by a computer comprising:
A step that recognizes the text pointer on the web page,
Stored in correspondence with at least a part of the identifier of the web page, text extraction range information relating to which range of words, sentences, paragraphs and whole sentences to be extracted for each characteristic of the web page to be extracted from among the steps of the text pointer identifying the text extraction range information for recognized the web page,
Based on the position of the recognized text pointer on the web page and the identified text extraction range information , the text in the web page corresponding to the position of the text pointer is expressed in words, sentences, paragraphs, or the method comprising to determine whether extracted with full text units to determine the text extraction range which differs by properties of the web page that the text pointer is recognized,
Extracting text in a web page in which the text pointer is recognized based on the determined text extraction range ;
Including methods.
ウェブページ上のテキストポインタを認識する段階と、
前記ウェブページの識別子の少なくとも一部に対応付けられ、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報を格納するテキスト抽出情報データベースを参照し、前記テキストポインタが認識されたウェブページに対する前記テキスト抽出範囲情報格納されているか否かを判別する段階と、
前記テキスト抽出情報データベースに前記テキスト抽出範囲情報が格納されていないと判別される場合に、前記ウェブページの特性毎のテキスト抽出範囲情報を格納する別途の最新テキスト抽出情報データベースから前記テキストポインタが認識されたウェブページのテキスト抽出範囲情報を受信する段階と、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記受信したテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定する段階と、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出する段階と、
を含む方法。 A method for extracting text based on characteristics of a web page, the steps performed by a computer comprising:
A step that recognizes the text pointer on the web page,
The attached corresponding to at least a portion of the identifier of the web page, text extraction for storing the word that is set in advance for each characteristic of the web page, text, text extraction range information on how to extract any range of paragraph and full text a step of referring to the information database, and determines whether it is stored the text extraction range information for a web page said text pointer is recognized,
If the text extraction range information is determined not to be stored in the text extraction information database, the text pointer recognition separately from the latest text extraction information database stores text extraction range information for each property of the web page the method comprising the steps of: receiving a text extraction range information of the web page, which is,
Based on the position of the recognized text pointer on the web page and the received text extraction range information , the text in the web page corresponding to the position of the text pointer is converted to a word unit, a sentence unit, a paragraph unit, or an entire sentence. the method comprising to determine whether to extract the unit, determines the text extraction range which differs by properties of the web page that the text pointer is recognized,
Extracting text in a web page in which the text pointer is recognized based on the determined text extraction range ;
Including methods.
請求項1または2に記載の方法によって抽出されたテキストと関連した音声データを生成する段階をさらに含む方法。 A method of converting text to speech, the steps performed by a computer comprising:
3. A method further comprising generating speech data associated with text extracted by the method of claim 1 or 2.
ウェブページ上のテキストポインタを認識するテキストポインタ認識部と、
前記ウェブページの識別子の少なくとも一部に対応して格納されている、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報の中から、前記テキストポインタが認識された前記ウェブページに対する前記テキスト抽出範囲情報を識別するテキスト抽出範囲情報確認部と、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記識別されたテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定するテキスト抽出範囲決定部と、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出するテキスト抽出部と、
を含むシステム。 A system for extracting text based on the characteristics of a web page,
And the text pointer recognition unit recognizes the text pointer on the web page,
Stored in correspondence with at least a part of the identifier of the web page, text extraction range information relating to which range of words, sentences, paragraphs and whole sentences to be extracted for each characteristic of the web page to be extracted from within the text extraction range information confirmation unit for identifying said text extraction range information for the said web page text pointer is recognized,
Based on the position of the recognized text pointer on the web page and the identified text extraction range information , the text in the web page corresponding to the position of the text pointer is expressed in words, sentences, paragraphs, or It determines whether or not to extract full text units, and text extraction range determining unit that determines the text extraction range which differs by properties of the web page that the text pointer is recognized,
A text extraction unit that extracts text in a web page in which the text pointer is recognized based on the determined text extraction range ;
Including system.
前記ウェブページの識別子の少なくとも一部に対応付けられ、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報を格納するテキスト抽出情報データベースと、
ウェブページ上のテキストポインタを認識するテキストポインタ認識部と、
前記テキスト抽出情報データベースを参照し、前記テキストポインタが認識されたウェブページに対する前記テキスト抽出範囲情報が格納されているか否かを判別し、前記テキスト抽出情報データベースに前記テキスト抽出範囲情報が格納されていないと判別される場合に、前記ウェブページの特性毎のテキスト抽出範囲情報を格納する別途の最新テキスト抽出情報データベースから前記テキストポインタが認識されたウェブページのテキスト抽出範囲情報を受信するテキスト抽出範囲情報受信部と、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記受信したテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定するテキスト抽出範囲決定部と、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出するテキスト抽出部と、
を含むシステム。 A system for extracting text based on the characteristics of a web page,
The attached corresponding to at least a portion of the identifier of the web page, text extraction for storing the word that is set in advance for each characteristic of the web page, text, text extraction range information on how to extract any range of paragraph and full text and information database,
And the text pointer recognition unit recognizes the text pointer on the web page,
Referring to the text extraction information database , it is determined whether or not the text extraction range information for the web page where the text pointer is recognized is stored, and the text extraction range information is stored in the text extraction information database. A text extraction range for receiving the text extraction range information of the web page in which the text pointer is recognized from a separate latest text extraction information database storing text extraction range information for each characteristic of the web page, and the information receiving unit,
Based on the position of the recognized text pointer on the web page and the received text extraction range information , the text in the web page corresponding to the position of the text pointer is converted to a word unit, a sentence unit, a paragraph unit, or an entire sentence. It determines whether or not to extract the unit, and text extraction range determining unit that determines the text extraction range which differs by properties of the web page that the text pointer is recognized,
A text extraction unit that extracts text in a web page in which the text pointer is recognized based on the determined text extraction range ;
Including system.
ウェブページ上のテキストポインタを認識するテキストポインタ認識部と、
前記ウェブページの識別子の少なくとも一部に対応して格納されている、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報の中から、前記テキストポインタが認識された前記ウェブページに対する前記テキスト抽出範囲情報を識別するテキスト抽出範囲情報確認部と、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記識別されたテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定するテキスト抽出範囲決定部と、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出するテキスト抽出部と、
前記抽出されたテキストと関連した音声データを生成する音声データ生成部と、
を含むシステム。 A system for converting text to speech,
And the text pointer recognition unit recognizes the text pointer on the web page,
Stored in correspondence with at least a part of the identifier of the web page, text extraction range information relating to which range of words, sentences, paragraphs and whole sentences to be extracted for each characteristic of the web page to be extracted from within the text extraction range information confirmation unit for identifying said text extraction range information for the said web page text pointer is recognized,
Based on the position of the recognized text pointer on the web page and the identified text extraction range information , the text in the web page corresponding to the position of the text pointer is expressed in words, sentences, paragraphs, or It determines whether or not to extract full text units, and text extraction range determining unit that determines the text extraction range which differs by properties of the web page that the text pointer is recognized,
Based on the determined text extraction range, a text extraction unit for extracting the text in a web page said text pointer is recognized,
A voice data generation unit that generates voice data associated with the extracted text ;
Including system.
ウェブページの識別子の少なくとも一部に対応付けられ、前記ウェブページの特性毎に予め設定された単語、文章、段落及び全文のうちどの範囲を抽出するかに関するテキスト抽出範囲情報を格納するテキスト抽出情報データベースと、
ウェブページ上のテキストポインタを認識するテキストポインタ認識部と、
前記テキスト抽出情報データベースを参照し、前記テキストポインタが認識されたウェブページに対する前記テキスト抽出範囲情報が格納されているか否かを判別し、前記テキスト抽出情報データベースに前記テキスト抽出範囲情報が格納されていないと判別される場合に、前記ウェブページの特性毎のテキスト抽出範囲情報を格納する別途の最新テキスト抽出情報データベースから前記テキストポインタが認識されたウェブページのテキスト抽出範囲情報を受信するテキスト抽出範囲情報受信部、
前記認識されたテキストポインタの前記ウェブページ上の位置と前記受信したテキスト抽出範囲情報とに基づいて、前記テキストポインタの位置に対応するウェブページ内のテキストを単語単位、文章単位、段落単位又は全文単位で抽出するか否かを判別し、前記テキストポインタが認識されたウェブページの特性別に相違するテキスト抽出範囲を決定するテキスト抽出範囲決定部、
前記決定されたテキスト抽出範囲に基づいて、前記テキストポインタが認識されたウェブページ内のテキストを抽出するテキスト抽出部と、
前記抽出されたテキストと関連した音声データを生成する音声データ生成部と、
を含むシステム。 A system for converting text to speech,
Text extraction information associated with at least a part of the identifier of the web page and storing text extraction range information regarding which range is extracted from words, sentences, paragraphs and whole sentences set in advance for each characteristic of the web page and the database,
And the text pointer recognition unit recognizes the text pointer on the web page,
Referring to the text extraction information database, the text extraction range information for a web page said text pointer is recognized, it is determined whether or not is stored, the text extraction range information stored in the text extracting information database A text extraction range for receiving the text extraction range information of the web page in which the text pointer is recognized from a separate latest text extraction information database storing text extraction range information for each characteristic of the web page, Information receiver,
Based on the position of the recognized text pointer on the web page and the received text extraction range information , the text in the web page corresponding to the position of the text pointer is converted to a word unit, a sentence unit, a paragraph unit, or an entire sentence. A text extraction range determination unit that determines whether or not to extract in units, and determines different text extraction ranges according to the characteristics of the web page in which the text pointer is recognized ;
Based on the determined text extraction range, a text extraction unit for extracting the text in a web page said text pointer is recognized,
A voice data generation unit that generates voice data associated with the extracted text ;
Including system.
The computer, computer-readable recording medium storing a program for causing execution of the steps of the method according to claim 1 or 2.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2007-0119406 | 2007-11-21 | ||
KR1020070119406A KR100958934B1 (en) | 2007-11-21 | 2007-11-21 | Method, system and computer-readable recording medium for extracting text based on characteristic of web page |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009129456A JP2009129456A (en) | 2009-06-11 |
JP4907635B2 true JP4907635B2 (en) | 2012-04-04 |
Family
ID=40726086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008295183A Expired - Fee Related JP4907635B2 (en) | 2007-11-21 | 2008-11-19 | Method, system and computer readable recording medium for extracting text based on the characteristics of a web page |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP4907635B2 (en) |
KR (1) | KR100958934B1 (en) |
CN (1) | CN101441648B (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101363155B1 (en) * | 2009-08-04 | 2014-02-14 | 배경아 | system and method for recogniting and searching the text included image area that pointed by a pointing device |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU769098B2 (en) * | 1999-05-28 | 2004-01-15 | Index Systems, Inc. | Method and system utilizing text selected on a web page for searching in a database of television programs |
KR20010099529A (en) * | 2000-04-27 | 2001-11-09 | 이장욱 | Method of Providing Information on the Web Page in the Internet TV Terminal |
JP2003248613A (en) * | 2001-11-20 | 2003-09-05 | Sharp Corp | Information distributing system and distributed information creating device used therein |
KR100451739B1 (en) * | 2002-01-21 | 2004-10-08 | 엘지전자 주식회사 | Internet TV and Method for Display Text of The Same |
CN100442283C (en) * | 2005-10-20 | 2008-12-10 | 关涛 | Extraction method and system of structured data of internet based on sample & faced to regime |
CN100472435C (en) * | 2005-12-31 | 2009-03-25 | 腾讯科技(深圳)有限公司 | Personal information management method based on personal information management software |
KR20070095179A (en) * | 2006-03-20 | 2007-09-28 | 삼성전자주식회사 | Pointing input device, method, and system using the image pattern |
-
2007
- 2007-11-21 KR KR1020070119406A patent/KR100958934B1/en active IP Right Grant
-
2008
- 2008-11-19 CN CN2008101770713A patent/CN101441648B/en active Active
- 2008-11-19 JP JP2008295183A patent/JP4907635B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20090052757A (en) | 2009-05-26 |
JP2009129456A (en) | 2009-06-11 |
CN101441648A (en) | 2009-05-27 |
KR100958934B1 (en) | 2010-05-19 |
CN101441648B (en) | 2011-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9530415B2 (en) | System and method of providing speech processing in user interface | |
US8849895B2 (en) | Associating user selected content management directives with user selected ratings | |
US9633653B1 (en) | Context-based utterance recognition | |
US9092542B2 (en) | Podcasting content associated with a user account | |
US8510277B2 (en) | Informing a user of a content management directive associated with a rating | |
US10771406B2 (en) | Providing and leveraging implicit signals reflecting user-to-BOT interaction | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
RU2360281C2 (en) | Data presentation based on data input by user | |
US20070214148A1 (en) | Invoking content management directives | |
JP2008090545A (en) | Voice interaction device and method | |
CN107430626A (en) | The Action query based on speech suggested is provided | |
US9342233B1 (en) | Dynamic dictionary based on context | |
CN102016905A (en) | Intelligent autocompletion | |
EP3602330B1 (en) | Automatically generating documents | |
JP2015530658A (en) | User interface device for user terminal and method for supporting the same | |
US20090282037A1 (en) | Method and system for providing convenient dictionary services | |
JP2016505955A (en) | Conversion from flat book to rich book in electronic reader | |
US11262978B1 (en) | Voice-adapted reformulation of web-based answers | |
US20170132198A1 (en) | Provide interactive content generation for document | |
JP4962416B2 (en) | Speech recognition system | |
EP3149729A1 (en) | Method and system for processing a voice-based user-input | |
JP4907635B2 (en) | Method, system and computer readable recording medium for extracting text based on the characteristics of a web page | |
KR20090055932A (en) | Method, system and computer-readable recording medium for extracting text based on tag information | |
KR100923942B1 (en) | Method, system and computer-readable recording medium for extracting text from web page, converting same text into audio data file, and providing resultant audio data file | |
JP5091465B2 (en) | Language conversion apparatus, language conversion method, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111213 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4907635 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |