JP2010139843A - Voice information collection device, and method and program for the same - Google Patents
Voice information collection device, and method and program for the same Download PDFInfo
- Publication number
- JP2010139843A JP2010139843A JP2008316921A JP2008316921A JP2010139843A JP 2010139843 A JP2010139843 A JP 2010139843A JP 2008316921 A JP2008316921 A JP 2008316921A JP 2008316921 A JP2008316921 A JP 2008316921A JP 2010139843 A JP2010139843 A JP 2010139843A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- text data
- voice information
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013480 data collection Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、各種情報サービスを提供する音声情報収集装置、その方法およびそのプログラムに関する。 The present invention relates to a voice information collection apparatus that provides various information services, a method thereof, and a program thereof.
従来、インターネットなどのネットワーク上で各種情報サービス(ダウンロード、アカウント作成など)を利用する際に、画像認証や音声認証という技術が用いられている。これらの技術は悪意のあるプログラムからの不正なアクセス(無作為かつ連続したパスワード入力など)を防止するための認証システムである。画像認証は、例えば、背景や文字の角度を加工した画像や、誰もが認識可能な画像を表示し、画像を表すテキストを入力させる。音声認証は、例えば、音声を流し、聞き取った音声をテキストで入力させる。 Conventionally, when various information services (downloading, account creation, etc.) are used on a network such as the Internet, techniques such as image authentication and voice authentication are used. These technologies are authentication systems for preventing unauthorized access (such as random and continuous password entry) from a malicious program. In the image authentication, for example, an image obtained by processing a background or a character angle or an image that can be recognized by anyone is displayed, and text representing the image is input. In the voice authentication, for example, a voice is played and the heard voice is input as text.
一方、個人認証等に用いられる音声認識という技術がある。音声認識は、人間が話す言葉をコンピュータによって解析し、話している内容を文字データとして取り出したり、個人を認識する技術であり、新しい入力手段として注目を集めている。この音声認識は、統計的手法が用いられるため、大量の発話を記録したデータが必要不可欠である。
例えば、言語学習を行うために、会話実例データや誤解事例データを公募し、会話場面に適応した学習用データを収集する技術が知られている(例えば、特許文献1)。
On the other hand, there is a technology called voice recognition used for personal authentication and the like. Speech recognition is a technology that analyzes words spoken by humans using a computer and extracts spoken content as character data or recognizes an individual, and has attracted attention as a new input means. Since this voice recognition uses a statistical method, data recording a large amount of utterances is indispensable.
For example, in order to perform language learning, a technique is known in which conversation example data and misunderstanding example data are solicited and learning data adapted to a conversation scene is collected (for example, Patent Document 1).
しかしながら、特許文献1では、語学学習用のデータを公募するため、対象となるのは語学学習者である。したがって、データを投稿するユーザは限られ、幅広く数多くのデータを収集するには制限がある。また、公募という形式でデータを収集することはユーザにとって負担となることが多く、たとえインセンティブを付与したとしても、データの収集を促進することは困難である。 However, in Japanese Patent Application Laid-Open No. 2004-260260, language learners are invited so that language learners are targeted. Therefore, the number of users who post data is limited, and there is a limit in collecting a large amount of data. In addition, collecting data in the form of public offering is often a burden on the user, and even if an incentive is given, it is difficult to promote data collection.
本発明の目的は、音声データを効率よく収集することのできる音声情報収集装置、その方法およびそのプログラムを提供することである。 An object of the present invention is to provide an audio information collecting apparatus, a method thereof, and a program thereof that can efficiently collect audio data.
本発明の音声情報収集装置は、ネットワークを介して接続された端末装置に対する情報サービスの提供と共に、音声情報の収集を行う音声情報収集装置であって、テキストデータとこのテキストデータの発音情報とを関連付けて記憶する音声情報記憶手段と、前記音声情報記憶手段に記憶されているテキストデータを前記端末装置に送信して表示させ、このテキストデータに対して端末装置で音声入力された音声情報を取得する音声情報取得手段と、前記取得した音声情報の音声認識を行い、その音声認識結果が前記送信したテキストデータの発音情報と一致する場合に、前記情報サービスの提供を開始する情報サービス提供手段と、前記音声情報取得手段が前記端末装置に表示させるテキストデータと同一の形式によって前記音声情報の収集対象となるテキストデータを、前記表示させたテキストデータと並列に前記端末装置に表示させて、ユーザに該収集対象となるテキストデータに対して音声入力させる音声入力要求手段と、を具備したことを特徴とする。 The voice information collection device of the present invention is a voice information collection device that collects voice information together with providing information services to terminal devices connected via a network, and includes text data and pronunciation information of the text data. The voice information storage means for storing in association and the text data stored in the voice information storage means are transmitted to the terminal device for display, and the voice information voice-input by the terminal device is acquired for the text data Voice information acquisition means that performs voice recognition of the acquired voice information, and information service provision means that starts providing the information service when the voice recognition result matches the pronunciation information of the transmitted text data The voice information acquisition means stores the voice information in the same format as the text data displayed on the terminal device. Voice input requesting means for causing the text data to be displayed to be displayed on the terminal device in parallel with the displayed text data and allowing the user to input voice to the text data to be collected. Features.
この発明は、テキストデータとその音声情報とを用いた音声認識により情報サービスを提供するとともに、テキストデータに対する音声情報を収集することができるものである。ここで、音声情報とは、テキストデータを人が発話した音声をデジタル化したデータであり、発音情報とは、音声データの読み方を示すデータである。
情報サービスの提供は、音声情報がすでに音声情報記憶手段に記憶されているテキストデータを用いて行われる。また、音声情報の収集対象は、音声情報記憶手段に記憶されている全てのテキストデータであるが、音声情報が記憶されていないテキストデータを用いることが好ましい。
The present invention provides an information service by voice recognition using text data and its voice information, and can collect voice information for the text data. Here, the voice information is data obtained by digitizing voice uttered by a person from text data, and the pronunciation information is data indicating how to read the voice data.
The provision of the information service is performed using text data in which voice information is already stored in the voice information storage means. The collection target of the voice information is all text data stored in the voice information storage unit, but it is preferable to use text data in which no voice information is stored.
この発明によれば、音声情報取得手段および情報サービス提供手段により、音声情報記憶手段に記憶されたテキストデータのうち音声情報がすでに記憶されているテキストデータを端末装置に送信して表示させ、このテキストデータに対して音声入力された音声情報を音声認識し、この音声認識結果と、音声情報記憶手段に記憶された発音情報とを照合し、一致すれば情報サービスを提供する。また、音声入力要求手段により、音声情報記憶手段に記憶されたテキストデータを、音声認識に用いたテキストデータとともに端末装置に送信して並列に表示させ、このテキストデータに対して音声入力させる。
このように、情報サービスを利用するための音声入力と音声情報を収集するための音声入力を同時に行わせることにより、ユーザに迷わせることなく音声入力を促すことができる。その結果、収集対象のテキストデータの音声情報を効率よく収集することができる。また、情報サービスの利用時には、ユーザは適切な情報を入力しようとするので、より適切な音声情報を入力させることができる。
According to this invention, the voice information acquisition means and the information service provision means transmit the text data in which the voice information is already stored among the text data stored in the voice information storage means to the terminal device for display. The speech information input by speech to the text data is recognized by speech, and the speech recognition result is compared with the pronunciation information stored in the speech information storage means. If they match, an information service is provided. Further, the text input request means sends the text data stored in the voice information storage means to the terminal device together with the text data used for voice recognition, displays the text data in parallel, and causes the text data to be voice-inputted.
As described above, by performing voice input for using the information service and voice input for collecting voice information at the same time, it is possible to prompt the user to input voice without hesitation. As a result, it is possible to efficiently collect voice information of text data to be collected. Further, when using the information service, the user tries to input appropriate information, so that more appropriate audio information can be input.
本発明の音声情報収集装置において、前記音声入力要求手段が表示させたテキストデータに対して音声入力された音声情報を、該テキストデータと対応付けて前記音声情報記憶手段に記憶させる入力情報格納手段を更に備えたことが好ましい。 In the voice information collecting apparatus of the present invention, input information storage means for storing voice information voice-input to text data displayed by the voice input request means in association with the text data and storing it in the voice information storage means Is preferably further provided.
この発明では、前述の音声情報収集装置において、収集対象のテキストデータに対して音声入力された音声情報を音声情報記憶手段に記憶させるので、より精度の高い音声情報を音声情報記憶手段に収集することができる。 In the present invention, since the voice information input to the text data to be collected is stored in the voice information storage means in the voice information collection device described above, more accurate voice information is collected in the voice information storage means. be able to.
本発明の音声情報収集装置において、前記テキストデータと、前記音声情報と、同一の前記音声情報を取得した回数と、を関連付けて記憶する入力候補記憶手段と、所定の前記テキストデータおよび前記音声情報における前記回数が所定回数以上である場合に登録可能と判定する登録判定手段と、をさらに備え、前記入力情報格納手段は、前記登録可能と判定された前記音声情報を前記テキストデータに対応付けて前記音声情報記憶手段に記憶させることが好ましい。 In the speech information collecting apparatus of the present invention, the text data, the speech information, and the number of times the same speech information is acquired are stored in association with each other, the predetermined text data and the speech information Registration determination means for determining that registration is possible when the number of times is equal to or greater than a predetermined number, and the input information storage means associates the speech information determined to be registerable with the text data. It is preferable to store in the voice information storage means.
この発明によれば、入力候補記憶手段には、音声情報記憶手段に記憶されているテキストデータが記憶され、このテキストデータに対して同一の音声情報を取得した回数が記憶されている。回数が多いほど周知性の高い情報であるといえるので、登録判定手段により所定回数以上取得した音声情報を登録可能とし、入力情報格納手段は登録可能とされた音声情報をテキストデータと対応付けて音声情報記憶手段に記憶させるので、テキストデータに対するより適切な音声情報を収集することができる。このようにして収集したデータは、信頼性が高い。 According to this invention, the input candidate storage means stores the text data stored in the speech information storage means, and stores the number of times the same speech information is acquired for the text data. As the number of times increases, it can be said that the information is more well-known. Therefore, it is possible to register the voice information acquired a predetermined number of times or more by the registration determination unit, and the input information storage unit associates the voice information that can be registered with the text data Since it is stored in the voice information storage means, more appropriate voice information for the text data can be collected. The data collected in this way is highly reliable.
本発明の音声情報収集装置において、キーワードの検索の検索履歴を記憶する検索履歴記憶手段をさらに備え、前記音声入力要求手段は、前記検索履歴に基づいて、検索率が急上昇した前記キーワードを前記検索履歴記憶手段から抽出して前記音声情報の収集対象となるテキストデータとして端末装置に表示させることが好ましい。 The voice information collection device of the present invention further comprises search history storage means for storing a search history of keyword search, wherein the voice input request means searches for the keyword whose search rate has rapidly increased based on the search history. It is preferable to extract from the history storage means and display it on the terminal device as text data to be collected voice information.
この発明では、音声入力要求手段により、検索履歴記憶手段に記憶された検索履歴に基づいて、検索率が急上昇したキーワードを抽出し、音声情報の収集対象のテキストデータとする。検索履歴記憶手段には検索サイト等で検索されたキーワードが記憶されるので、話題性および流行性の高いキーワード等がいち早く記憶される。また、これらのキーワードのうち、検索率が急上昇したキーワードはより話題性および流行性が高い。したがって、話題性および流行性の高いキーワードに対する音声情報を迅速かつ高い精度で収集することができる。 In this invention, the voice input request means extracts the keyword whose search rate has increased rapidly based on the search history stored in the search history storage means, and sets it as text data to be collected voice information. The search history storage means stores keywords searched at a search site or the like, so that keywords with high topicality and fashion are stored quickly. Of these keywords, the keyword whose search rate has increased rapidly has higher topicality and fashionability. Therefore, it is possible to quickly and accurately collect voice information for keywords with high topicality and popularity.
本発明の音声情報収集装置において、前記テキストデータを画像に変換した画像データを生成する画像変換手段をさらに備えたことが好ましい。
この発明によれば、音声情報記憶手段から抽出されたテキストデータを画像データに変換し、変換したそれぞれの画像データを端末装置に送信して表示させる。画像データは解析されにくいため、不正アクセス等を防止することができ、セキュリティ性を向上させることができる。
The audio information collecting apparatus according to the present invention preferably further comprises image conversion means for generating image data obtained by converting the text data into an image.
According to the present invention, the text data extracted from the voice information storage means is converted into image data, and each converted image data is transmitted to the terminal device for display. Since image data is difficult to analyze, unauthorized access and the like can be prevented, and security can be improved.
本発明の音声情報収集装置において、前記テキストデータは、広告に関するテキストデータであることが好ましい。
この発明によれば、テキストデータとして広告に関するテキストデータを用いる。広告に関するテキストデータとは、例えば、商品名、メーカー名、キャッチフレーズなど商品またはサービスに関する情報であり、これらの情報がテキストで表示される。そのため、各種情報サービスを利用するたびにこの広告テキストがユーザの目に留まるとともに、その広告テキストをユーザ自身が声に出して発話するので、広告効果の向上を図ることができる。
In the audio information collecting apparatus of the present invention, it is preferable that the text data is text data related to an advertisement.
According to the present invention, the text data related to the advertisement is used as the text data. The text data related to the advertisement is, for example, information related to a product or service such as a product name, a manufacturer name, and a tagline, and the information is displayed in text. For this reason, every time the various information services are used, the advertisement text is noticed by the user, and the advertisement text is uttered by the user himself / herself, so that the advertising effect can be improved.
本発明の音声情報収集方法は、ネットワークを介して接続された端末装置に対する情報サービスの提供と共に、音声情報の収集を行う音声情報収集方法であって、テキストデータとこのテキストデータの発音情報とを関連付けて音声情報記憶手段に記憶させ、前記音声情報記憶手段に記憶されているテキストデータを前記端末装置に送信して表示させ、このテキストデータに対して端末装置で音声入力された音声情報を取得し、前記取得した音声情報の音声認識を行い、その音声認識結果が前記送信したテキストデータの発音情報と一致する場合に、前記情報サービスの提供を開始し、前記音声情報取得手段が前記端末装置に表示させるテキストデータと同一の形式によって前記音声情報の収集対象となるテキストデータを、前記表示させたテキストデータと並列に前記端末装置に表示させて、ユーザに該収集対象となるテキストデータに対して音声入力させることを特徴とする。 The voice information collection method of the present invention is a voice information collection method for collecting voice information as well as providing an information service to a terminal device connected via a network. The voice information collection method includes text data and pronunciation information of the text data. Associating and storing the voice data in the voice information storage means, transmitting the text data stored in the voice information storage means to the terminal device for display, and obtaining the voice information inputted by voice from the terminal device to the text data When the acquired speech information is recognized, and the result of the speech recognition matches the pronunciation information of the transmitted text data, the provision of the information service is started, and the speech information acquisition means is the terminal device. The text data to be collected from the voice information is displayed in the same format as the text data to be displayed on the display. Text to display data in parallel with the terminal device, and wherein the to voice input to text data to be the collection object to the user.
この発明によれば、音声情報記憶手段に記憶されたテキストデータのうち音声情報がすでに記憶されているテキストデータを端末装置に送信して表示させ、このテキストデータに対して音声入力された音声情報を音声認識し、この音声認識結果と、音声情報記憶手段に記憶された発音情報とを照合し、一致すれば情報サービスを提供する。また、音声情報記憶手段に記憶されたテキストデータを、音声認識に用いたテキストデータとともに端末装置に送信して並列に表示させ、このテキストデータに対して音声入力させる。
このように、情報サービスを利用するための音声入力と音声情報を収集するための音声入力を同時に行うことにより、ユーザに迷わせることなく音声入力を促すことができる。その結果、収集対象のテキストデータの音声情報を効率よく収集することができる。また、情報サービスの利用時には、ユーザは適切な情報を入力しようとするので、より適切な音声情報を入力させることができる。
According to the present invention, text data in which voice information is already stored among the text data stored in the voice information storage means is transmitted to the terminal device for display, and the voice information input by voice to the text data is displayed. The voice recognition result is compared with the pronunciation information stored in the voice information storage means, and if they match, an information service is provided. The text data stored in the voice information storage means is transmitted to the terminal device together with the text data used for voice recognition, displayed in parallel, and voice input is performed on the text data.
Thus, by performing voice input for using the information service and voice input for collecting voice information at the same time, it is possible to prompt the user to input voice without hesitation. As a result, it is possible to efficiently collect voice information of text data to be collected. Further, when using the information service, the user tries to input appropriate information, so that more appropriate audio information can be input.
本発明の音声情報収集プログラムは、前述の音声情報収集方法をコンピュータに実行させることを特徴とする。
本発明の音声情報収集プログラムは、コンピュータを前述の音声情報収集装置として機能させることを特徴とする。
この発明によれば、音声情報収集プログラムにより、コンピュータに前述の音声情報収集方法を実施させるため、この音声情報収集プログラムをインストールするだけの簡単な構成で、前述と同様の作用効果を得ることでき、有用性が高い。
The audio information collection program of the present invention causes a computer to execute the above-described audio information collection method.
The voice information collection program of the present invention is characterized by causing a computer to function as the aforementioned voice information collection device.
According to the present invention, the voice information collecting program causes the computer to carry out the voice information collecting method described above, so that the same operational effects as described above can be obtained with a simple configuration simply by installing the voice information collecting program. Highly useful.
〔第1実施形態〕
本発明の第1実施形態を図1から図4に基づいて説明する。
図1は、本発明の第1実施形態にかかるサービス提供システムの概略構成を示すブロック図であり、図2は、前記第1実施形態におけるサービス提供サーバの概略構成を示すブロック図である。図3は、前記第1実施形態における開始ページが画面表示された状態を示す概略図である。図4は、前記第1実施形態におけるサービス提供サーバの動作を示すフローチャートである。
[サービス提供システムの構成]
図1に示すように、サービス提供システム10は、サービス提供サーバ100と、インターネット20を介してサービス提供サーバ100に接続されたウェブサーバ200と、端末装置300と、を備えている。
[First Embodiment]
A first embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram showing a schematic configuration of a service providing system according to the first embodiment of the present invention, and FIG. 2 is a block diagram showing a schematic configuration of a service providing server in the first embodiment. FIG. 3 is a schematic diagram showing a state where the start page is displayed on the screen in the first embodiment. FIG. 4 is a flowchart showing the operation of the service providing server in the first embodiment.
[Service providing system configuration]
As shown in FIG. 1, the
インターネット20はTCP/IPなどの汎用のプロトコルに基づくインターネットであるが、これに限られない。例えば、LAN(Local Area Network)などのイントラネット、無線媒体により情報が送受信可能な複数の基地局がネットワークを構成する通信回線網や放送網などのネットワーク、さらには、データを直接受信するための媒体となる無線媒体自体など、データを送受信させるいずれの構成も利用できる。
The
サービス提供サーバ100は、情報サービスを提供するとともに、テキストデータに対する音声情報を収集する機能を有する。すなわち、サービス提供サーバ100は、本発明における音声情報収集装置として機能するものである。
図2に示すように、サービス提供サーバ100は、記憶手段として、音声情報記憶手段としての音声情報データベース101と、入力候補記憶手段としての音声候補データベース102と、検索履歴記憶手段としての検索履歴データベース103と、を備えている。
The
As shown in FIG. 2, the
音声情報データベース101は、例えば、以下の表1に示すように、テキストデータごとにこのテキストデータを表す音声データとこのテキストデータの読みを示す発音情報としての読みデータが1つのレコードとして記憶されたテーブル構造となっている。音声データはテキストを発話した音声をデジタル化したデータが各種データ形式で記憶される。読みデータはカタカナまたはひらがなのテキストデータとして記憶される。なお、音声情報データベース101には、各テキストデータに対する音声データが記憶されているものと記憶されていないものとが存在する。
For example, as shown in Table 1 below, the
音声候補データベース102は、例えば、以下の表2に示すように、テキストデータごとにこのテキストの音声データ候補と、この音声データ候補に基づいた読みデータ候補と、同一のテキストデータおよび同一の音声データ候補が入力された入力回数とが1つのレコードとして記憶されたテーブル構造となっている。テキストデータは、前述の音声情報データベース101に記憶されているテキストデータと同一のテキストデータが記憶され、1つのテキストデータに対して複数の音声データ候補および複数の読みデータ候補が存在し得る。音声データ候補としては、ユーザによって音声入力された音声データが記憶され、読みデータ候補には、カタカナまたはひらがなのテキストが記憶される。入力回数には、同一のテキストに対して同一の音声データ候補が音声入力された回数が記憶される。
For example, as shown in Table 2 below, the
検索履歴データベース103は、例えば、以下の表3に示すように、キーワードごとにこのキーワードの検索回数および検索日が1つのレコードとして記憶されたテーブル構造となっている。キーワードは、検索サイト等で検索されたキーワードが記憶される。
For example, as shown in Table 3 below, the
また、サービス提供サーバ100は、演算処理手段として、音声入力要求手段110と、画像変換手段120と、音声情報取得手段130と、音声認識手段140と、登録判定手段150と、入力情報格納手段としての音声登録手段160と、サービス提供判断手段170と、情報サービス提供手段としてのサービス提供手段180と、テキスト抽出手段190と、を備えている。また、図示しないが、インターネット20を介してデータを送受信するデータ送受信手段と、ウェブページを画面表示として出力させる出力手段と、キーボードなどの入力手段と、などを備えていてもよい。
In addition, the
音声入力要求手段110は、サービスの利用を開始するための開始ページに関する情報をインターネット20を介して端末装置300に送信する。この開始ページに関する情報には、サービスの利用を許可するために用いられる認証テキストデータと音声を収集するために用いられる対象テキストデータのほか、後述の開始ページを形成するフォーム等の情報が含まれる。認証テキストデータとしては、音声情報データベース101に記憶されたテキストデータのうち、音声データおよび読みデータがすでに記憶されているテキストデータをランダムに抽出する。また、対象テキストデータとしては、音声情報データベース101に記憶されたテキストデータのうち、音声データおよび読みデータが記憶されていないものを優先的に抽出する。
The voice
画像変換手段120は、音声入力要求手段110によって抽出された認証テキストデータおよび対象テキストデータを、画像データに変換する。例えば、各種文字のフォント画像を予め図示しない記憶手段に記憶させておき、一文字ずつ該当するフォント画像を抽出し、抽出したフォント画像を組み合わせて、該テキストデータに対応する画像を生成する。そして、この画像をビットマップ形式の画像データ(ドットパターンで表現された画像データ)に変換し、乱数を用いて歪ませるなどして変形させる。なお、テキストデータを画像データに変換する方法はこれに限られず、任意のの方法を用いることができる。
The
このように、音声入力要求手段110および画像変換手段120により送信された情報が端末装置300の出力手段によって画面表示された開始ページを具体的に図3に示す。
図3に示されるように、開始ページ30は、サービスを開始するために用いられる認証領域31と、音声収集のために用いられる対象領域32と、OKボタン33と、キャンセルボタン34と、音声入力を促す文章を表示する操作説明部35と、を備えている。
FIG. 3 specifically shows the start page in which the information transmitted by the voice
As shown in FIG. 3, the
認証領域31には、認証テキスト表示部311と、音声入力が可能であることを表すマイクを画像表示させたマイク表示部312と、認証テキスト表示部311に表示された認証テキストの音声入力を開始するための入力開始ボタン313と、認証テキスト表示部311に表示された認証テキストの音声入力を終了するための入力終了ボタン314と、が設けられている。認証テキスト表示部311には、認証テキストデータが画像変換された画像データが表示される。また、入力開始ボタン313が押下され、次に入力終了ボタン314が押下されるまでの間に入力される音声が認証音声データとして収集される。
In the
対象領域32には、対象テキスト表示部321と、音声入力が可能であることを表すマイクを画像表示させたマイク表示部322と、対象テキスト表示部321に表示されたテキストの音声入力を開始するための入力開始ボタン323と、対象テキスト表示部321に表示されたテキストの音声入力を終了するための入力終了ボタン324と、が設けられている。対象テキスト表示部321には、対象テキストデータが画像変換された画像データが表示される。また、入力開始ボタン323が押下され、次に入力終了ボタン324が押下されるまでの間に入力される音声が対象音声データとして収集される。
In the
このように、ユーザに音声入力を促すための認証領域31と対象領域32との表示形式を同一とすることで、ユーザには音声収集を意識させずに、サービス利用を目的として音声入力させることができるため、効率よく音声情報を収集することができる。
Thus, by making the display format of the
OKボタン33は、押下されると、取得した認証音声データおよび対象音声データをサービス提供サーバ100へ送信する。
キャンセルボタン34は、処理を中止する。
操作説明部35には、音声入力を促す説明文が表示される。認証テキストおよび対象テキストのどちらも音声入力されるような文章が好ましく、例えば、図3に示すように、「次の2つの読みを音声入力してください。」と表示する。
When the
The cancel
In the
音声情報取得手段130は、端末装置300の出力手段に表示された開始ページ30において音声入力された認証音声データと対象音声データとを取得する。具体的には、端末装置300で音声入力されたこれらの音声データがサービス提供サーバ100へ送信され、サービス提供サーバ100のデータ送受信手段で受信する。
The voice
音声認識手段140は、音声情報取得手段130により取得した認証音声データおよび対象音声データを認識し、テキストデータ(変換テキスト)に変換する。音声データをテキストデータに変換する方法は特に限定されず、公知の方法を用いることができる。
The
登録判定手段150は、取得した対象音声データを、音声情報データベース101へ登録可能か否かを判定する。具体的には、開始ページ30の対象テキスト表示部321に画像として表示された対象テキストデータと、取得した対象音声データと、音声認識手段140により対象音声データをテキストへ変換した変換テキストとを、音声候補データベース102に記憶されているテキストと音声データ候補と読み候補とに関連付ける。該当するテキストデータ、音声データ候補および読み候補の入力回数が例えば2回以上であれば登録可能とし、入力回数が2回未満であれば登録不可とする。すなわち、1つのテキストに対して同一の音声データ候補および読み候補が3回以上入力されると登録可となる。したがって、入力回数が1回であれば、音声候補データベース102の入力回数をプラス1の値に更新し、該当するテキストが未登録であれば、新規に音声候補データベース102に記憶させる。
The
音声登録手段160は、登録判定手段150で登録可能と判定された対象音声データを、音声情報データベース101に記憶させる。音声情報データベース101には、該当するテキストデータはすでに記憶されているので、音声データと、その読みデータを記憶させる。1つのテキストデータに対して1つまたは複数の音声データを記憶させることができる。また、ユーザ認証などにより同一のユーザにより登録された音声データや、類似する音声データがすでに登録済みである場合は、登録を行わないようにしてもよい。
The
サービス提供判断手段170は、開始ページ30に認証テキスト画像として表示させた認証テキストデータと取得した認証音声データとを用いてサービス提供の可否を判定する。具体的には、認証テキストデータと認証音声データと音声認識手段140により認証音声データをテキストデータへ変換した変換テキストとを、音声情報データベース101に記憶されているテキストデータと音声データと読みデータに関連付ける。該当するデータがあればサービス提供可とする。音声情報データベース101には、1つのテキストデータに対して複数の音声データが記憶されているので、いずれか1つの音声データと一致すればよい。一致するテキストデータがない場合はサービス提供不可とする。
The service
サービス提供手段180は、サービス提供判断手段170でサービス提供可とされた場合に、サービスを提供する。サービスとしては、ダウンロード、新規アカウントの作成などの各種サービスが挙げられ、各種サービスのトップページやサービス開始ページに関する情報を端末装置300に対して送信し、これらのウェブページに表示された内容に応じて各種サービスが利用可能となる。
The
テキスト抽出手段190は、検索履歴データベース103に記憶されているキーワードのうち、検索回数が急上昇したキーワードを抽出して、このキーワードを音声情報データベース101に記憶させる。例えば、検索履歴データベース103には日ごとの検索回数が記憶されているので、前日と当日との検索回数の比が所定値を超えたキーワードを、急上昇ワードをして抽出し、音声情報データベース101に記憶させる。テキスト抽出手段190が検索履歴データベース103をチェックする頻度は定期的に行われ、例えば、1時間ごと、3時間ごと、5時間ごと、など適宜調整することができる。
また、音声入力要求手段110は、音声情報データベース101からテキストデータを抽出することもでき、テキスト抽出手段190を介して検索回数が急上昇したキーワードを抽出することもできる。
The
Further, the voice
ウェブサーバ200は、各種情報をウェブサイト上で提供する装置であり、例えば、検索サイトのウェブページが登録されている。
端末装置300は、図示しないが、演算処理手段として、サービス提供サーバ100に対して利用したいサービスを要求し、要求したサービスのウェブページを受信する端末送受信手段と、ウェブページを画面表示として出力させる出力手段と、文字入力可能なマウスやキーボード、および音声入力可能なマイクなどの入力手段とを備えている。一方、記憶手段としては、各種フォームにかかわるフォームデータを記憶するデータベースなどを備えている。端末装置300としては特に限定されないが、例えば、携帯電話やノートパソコンなどが挙げられる。
なお、図1においては、1つの端末装置300と1つのサービス提供サーバ100とが接続された構成を例示したが、実際には、サービス提供サーバ100は、多数の端末装置300に接続されている。
The
Although not shown, the
1 illustrates a configuration in which one
[サービス提供システムの動作]
次に、サービス提供システム10の動作を図1、図2および図4に基づいて説明する。
まず、ユーザは、端末装置300の入力手段を入力操作し、サービス提供サーバ100にアクセスするために、例えば、ウェブブラウザを起動させてアドレスを入力し、利用したい情報サービス、例えばダウンロードサービスを要求する。
ステップS1において、サービス提供サーバ100は、図示しない送受信手段により情報サービスの要求を受信するとS2に進む。
ステップS2では、音声入力要求手段110が、図3に示す開始ページ30として表示するための認証画像データや対象画像データなどの開始ページ情報を端末装置300に送信する。認証画像データは認証テキスト表示部311に表示されるものであり、音声情報データベース101に記憶されているテキストデータのうち音声データが記憶されているテキストデータをランダムに抽出し、画像変換手段120により画像変換されたものである。また、対象画像データは対象テキスト表示部321に表示されるものであり、音声情報データベース101に記憶されているテキストデータのうち音声データが記憶されていないテキストデータを優先的に抽出し、画像変換手段120により画像変換されたものである。
[Service delivery system operation]
Next, the operation of the
First, in order to access the
In step S1, when the
In step S <b> 2, the voice
端末装置300は、図示しない送受信手段で開始ページ情報を受信し、出力手段により開始ページ30を画像表示する。これにより、開始ページ30において、ユーザは、入力開始ボタン313を押下した後、マイク等の入力手段を用いて認証テキスト表示部311に表示されているテキストを読んで音声入力を開始する。そして、入力終了ボタン314を押下して音声入力を終了させる。同様に、入力開始ボタン323を押下した後、マイク等の入力手段を用いて対象テキスト表示部321に表示されているテキストを読んで音声入力を開始する。そして、入力終了ボタン324を押下して音声入力を終了させる。ユーザがOKボタン33を押すと、音声入力された認証音声データおよび対象音声データが、サービス提供サーバ100に送信される。
The
ステップS3では、サービス提供サーバ100の音声情報取得手段130が、端末装置300で入力された認証音声データおよび対象音声データを取得してステップS4へ進む。具体的には、送受信手段により認証音声データおよび対象音声データを受信する。
ステップS4では、音声認識手段140が、取得した認証音声データおよび対象音声データを認識し、テキストデータに変換した後、ステップS5へ進む。なお、ここで変換したテキストデータは、音声データの読みデータとなるものである。
ステップS5では、登録判定手段150が、取得した対象音声データが音声情報データベース101に登録可能であるか否かを判定する。具体的には、開始ページ30の対象テキスト表示部321に画像データとして表示された対象テキスト、取得した対象音声データおよび対象音声データをテキスト変換して生成した読みデータと、音声候補データベース102に記憶されたテキストデータ、音声データ候補および読みデータ候補とを照合する。一致するデータがある場合、その入力回数が2回以上であれば、登録可能であると判定し、ステップS6へ進む。一方、入力回数が2回未満であれば、所定数以上の入力がないため登録不可であると判定し、ステップS7へ進む。
In step S3, the voice
In step S4, the
In step S <b> 5, the
ステップS6では、音声登録手段160が登録可能とされた対象音声データおよびその読みデータを、音声情報データベース101に記憶された該当するテキストデータの音声データおよび読みデータとして記憶させ、ステップS8へ進む。なお、音声情報データベース101に同一の音声データおよび読みデータがすでに記憶されている場合は処理を行わない。そして、音声候補データベース102の該当するテキストデータ、音声データ候補および読みデータ候補の入力回数を1加算した値で更新する。
ステップS7では、音声候補データベース102の該当するテキストデータと音声データ候補と読みデータ候補の入力回数を1加算した値で更新する。また、音声候補データベース102に、取得した音声データおよび読みデータと一致する音声データ候補および読みデータ候補がない場合は、新規に記憶させてステップS8へ進む。
In step S6, the target voice data and the reading data that can be registered by the
In step S7, the number of inputs of the corresponding text data, speech data candidate, and reading data candidate in the
ステップS8では、サービス提供判断手段170が、ステップS3で取得した認証音声データおよびステップS4でテキスト変換したテキストデータが、音声情報データベース101に記憶された該当するテキストデータの音声データおよび読みデータと一致するか否かを判定し、一致すればサービス提供可としてステップS9へ進む。一方、不一致であればサービス提供不可となり、ステップS2へ戻り、再度開始ページ30を送信して、音声入力を要求する。このとき、認証テキスト表示部311に表示させる認証テキスト画像を別の認証テキスト画像に変更してもよい。
ステップS9では、サービス提供手段180が、端末装置300に対して各種サービスを提供する。本実施形態では、ダウンロードサービスとして、例えば、ダウンロードするファイルを送信して、端末装置300の出力手段等により画面表示させる。
In step S8, the authentication voice data acquired in step S3 by the service
In step S <b> 9, the
また、テキスト抽出手段190は、定期的に検索履歴データベース103にアクセスし、前日と本日の検索履歴の比が所定値以上となる急上昇ワードを抽出し、テキストデータとして音声情報データベース101に記憶させている。
Further, the text extraction means 190 periodically accesses the
[第1実施形態の作用効果]
上述した第1実施形態では、以下に示す作用効果を奏することができる。
サービス提供サーバ100は、サービス提供判断手段170により開始ページ30に画像表示された認証テキストデータとこの認証テキストデータに対して音声入力された認証音声データでサービス提供の可否を判断する一方、登録判定手段150と音声登録手段160により開始ページ30で音声入力された対象テキストデータに対する対象音声データを音声情報データベース101に記憶させる。
すなわち、サービスを提供するたびに対象テキストデータの対象音声データを収集することができ、データの収集を行っていることをユーザに意識させることなく統計的なデータを収集することができる。また、サービス提供のために音声入力させる認証テキストデータと、音声収集のために音声入力させる対象テキストデータとを同一形式で並列に表示することで、ユーザに音声収集を意識させることなく、音声入力を促すことができる。
[Effects of First Embodiment]
In the first embodiment described above, the following operational effects can be achieved.
The
That is, the target voice data of the target text data can be collected every time the service is provided, and statistical data can be collected without making the user aware of the data collection. In addition, by displaying the authentication text data for voice input for service provision and the target text data for voice input for voice collection in parallel in the same format, voice input without making the user aware of voice collection Can be encouraged.
また、1つのテキストデータに対して同一の音声データおよび同一の読みデータが3回以上入力された場合に、その対象音声データおよび読みデータを音声情報データベース101に記憶させることとしたので、信頼性の高いデータを収集することができる。このように収集した音声情報データベース101は、音声データベースとして広く利用することができ、有用性が高い。
Further, when the same voice data and the same reading data are input three times or more for one text data, the target voice data and the reading data are stored in the
また、テキスト抽出手段190は、定期的に検索履歴データベース103にアクセスし、検索回数が急上昇したキーワードを抽出して音声情報データベース101に記憶させている。検索回数が急上昇したキーワードはその時の話題や流行を表すものであるので、これらのキーワードに対する音声データを効率よくかつ迅速に収集することができる。したがって、最新のキーワードに対する音声データを迅速かつ高い精度で収集することができる。
Further, the
さらに、本実施形態では、認証テキスト表示部311および対象テキスト表示部321には、画像変換手段120によりテキストデータを画像変換し、画像データとして表示させることとした。画像データは解析されにくいため、不正アクセス等を防止することができ、セキュリティ性の向上を図ることができる。
Furthermore, in this embodiment, the authentication
〔第2実施形態〕
本発明の第2実施形態を、図5に基づいて説明する。
図5は、本発明の第2実施形態におけるサービス提供サーバの概略構成を示すブロック図である。
[サービス提供システムの構成]
第2実施形態では、広告情報データベース104に記憶された広告テキストデータを用いて認証を行う以外は、第1実施形態と同様の構成である。以下、第1実施形態と異なる構成について説明する。
[Second Embodiment]
A second embodiment of the present invention will be described with reference to FIG.
FIG. 5 is a block diagram showing a schematic configuration of a service providing server according to the second embodiment of the present invention.
[Service providing system configuration]
In the second embodiment, the configuration is the same as that of the first embodiment except that the authentication is performed using the advertisement text data stored in the
広告情報データベース104は、例えば、以下の表4に示すように、広告用の広告テキストデータごとにこの広告画像に関する広告属性情報である音声データとその読みデータが1つのレコードとして記憶されたテーブル構造となっている。広告テキストデータとしては、例えば、広告画像データに表示された商品の名称、メーカー、キャッチフレーズなどが挙げられ、これらがテキストデータとして記憶される。読みデータは、音声データを分析してテキストに変換されたテキストデータがカタカナで記憶される。なお、読みデータはひらがなでもよい。
For example, as shown in Table 4 below, the
また、広告テキストデータでサービス提供の可否を判断することにより、音声入力要求手段112、サービス提供判断手段172の動作が第1実施形態と異なるので、これらについて説明する。
音声入力要求手段112は、サービスの利用を開始するための開始ページに関する情報をインターネット20を介して端末装置300に送信する。この開始ページに関する情報には、サービス提供の可否を判断するための認証画像と音声を収集するための対象画像のほか、開始ページを形成するフォーム等の情報が含まれる。認証画像としては、広告情報データベース104からランダムに抽出された広告テキストデータを画像変換手段120により画像変換した画像データが表示され、対象画像としては、音声情報データベース101に記憶されたテキストのうち、音声データおよび読みデータが記憶されていないものを優先的に抽出して画像変換手段120により画像変換した画像データを表示させる。
Further, since the operations of the voice
The voice
サービス提供判断手段172は、開始ページ30に画像表示させた広告テキストデータと、取得した広告音声データとを用いてサービス提供の可否を判定する。具体的には、認証画像として画像表示させた広告テキストデータ、取得した広告音声データおよび音声認識手段140により広告音声データからテキスト変換された読みデータを、音声情報データベース101に記憶されている広告テキストデータ、音声データおよび読みデータと照合する。これらが一致すればサービス提供可とする。広告情報データベース104には、1つの広告テキストデータに対して複数の音声データおよび読みデータが記憶されているので、いずれか1つの音声データおよび読みデータと一致すればよい。一致するデータがない場合はサービス提供不可とする。
The service
以上の構成のサービス提供サーバ400は、第1実施形態と同様の動作により、音声情報データベース101に記憶されたテキストデータの音声データを収集することができる。なお、広告情報データベース104には、インターネット20を介して接続された図示しない広告主端末から送信される広告情報に基づいてデータが記憶される。
The
[第2実施形態の作用効果]
上述した第2実施形態では、第1実施形態における作用効果のほかにも、以下に示す作用効果を奏することができる。
サービス提供サーバ400は、開始ページ30に広告テキストデータを画像として表示させることとした。したがって、サービスの利用を開始するたびに広告が表示されるので広告効果の向上を図ることができる。特に、サービスを利用する際に必ず表示される開始ページ30に広告を表示することはユーザの目に留まりやすく、広告効果が高い。また、広告テキストをユーザがそのまま発話するため、ユーザに商品名やメーカー名、キャッチフレーズ等を認識させる効果が高まり、広告効果の向上が図れる。
[Effects of Second Embodiment]
In the second embodiment described above, the following operational effects can be obtained in addition to the operational effects of the first embodiment.
The
[変形例]
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、例えば、以下に示される変形をも含むものである。
音声情報データベース101において、1つのテキストデータに対する音声データが複数ある場合、テキストデータごとにグループ化した音声データ集を作成することができる。このように、複数の音声データを収集することができるので、音声情報データベースとして使用する場合の精度の向上を図ることができる。
[Modification]
In addition, this invention is not limited to embodiment mentioned above, In the range which can achieve the objective of this invention, the deformation | transformation shown below is also included, for example.
When there are a plurality of voice data for one text data in the
また、上記実施形態では、サービス提供の可否に関わらず対象音声入力情報を音声情報記憶手段に記憶させることとしたが、サービス提供可となった場合にのみ記憶させることとしてもよい。サービス提供可となるには正確な音声を入力する必要があるので、再入力させることにより、より信頼性の高い音声情報を収集することができる。また、誤操作による雑音や日本語を知らない人の音声データなど明らかに異なる音声データを排除できる可能性が高い。
さらに、上記実施形態で用いた音声情報記憶手段は、音声データのそれに対する読みデータを収集する構成としたが、これに限られず、収集したい情報に応じて適宜項目を変更してもよいし増減させてもよい。
In the above embodiment, the target voice input information is stored in the voice information storage unit regardless of whether or not the service can be provided. However, the target voice input information may be stored only when the service can be provided. Since it is necessary to input an accurate voice in order to be able to provide a service, more reliable voice information can be collected by re-input. In addition, there is a high possibility that it is possible to eliminate clearly different voice data such as noise caused by erroneous operation and voice data of a person who does not know Japanese.
Further, the voice information storage means used in the above embodiment is configured to collect the reading data of the voice data. However, the present invention is not limited to this, and the items may be appropriately changed or increased / decreased depending on the information to be collected. You may let them.
さらに、上記実施形態では、画像変換手段120により音声情報データベース101から取得したテキストデータを画像データに変換したが、テキストデータを変換せずに、そのまま端末装置に送信して表示させるようにしてもよい。これによれば、サービス提供サーバ100の構成を簡略化することができるとともに、処理を高速化することができる。
Furthermore, in the above embodiment, the text data acquired from the
そして、上記実施形態では、登録判定手段150は、端末装置300に表示させた対象テキストデータに対して、同一の対象音声データが3回音声入力された場合に、音声情報データベース101に登録可としていたが、登録の可否を判定する回数はこれに限られない。信頼性を高めるためには、回数を増やすことが好ましい。
なお、認証テキストデータおよび認証音声データによってサービスの利用を許可された回数が多いユーザは信頼性が高いため、信頼性の高い音声データを収集することができる。
In the above embodiment, the
In addition, since the user who has been permitted to use the service by the authentication text data and the authentication voice data has high reliability, the voice data with high reliability can be collected.
本発明は、各種情報サービスを提供する音声情報収集装置として利用できる。 The present invention can be used as a voice information collection device that provides various information services.
10 サービス提供システム
20 インターネット
30 開始ページ
31 認証領域
32 対象領域
100 サービス提供サーバ
101 音声情報データベース
102 音声候補データベース
103 検索履歴データベース
104 広告情報データベース
110、112 音声入力要求手段
120 画像変換手段
130 音声情報取得手段
140 音声認識手段
150 登録判定手段
160 音声登録手段
170、172 サービス提供判断手段
180 サービス提供手段
190 テキスト抽出手段
200 ウェブサーバ
300 端末装置
DESCRIPTION OF
Claims (9)
テキストデータとこのテキストデータの発音情報とを関連付けて記憶する音声情報記憶手段と、
前記音声情報記憶手段に記憶されているテキストデータを前記端末装置に送信して表示させ、このテキストデータに対して端末装置で音声入力された音声情報を取得する音声情報取得手段と、
前記取得した音声情報の音声認識を行い、その音声認識結果が前記送信したテキストデータの発音情報と一致する場合に、前記情報サービスの提供を開始する情報サービス提供手段と、
前記音声情報取得手段が前記端末装置に表示させるテキストデータと同一の形式によって前記音声情報の収集対象となるテキストデータを、前記表示させたテキストデータと並列に前記端末装置に表示させて、ユーザに該収集対象となるテキストデータに対して音声入力させる音声入力要求手段と、を具備した
ことを特徴とする音声情報収集装置。 A voice information collection device that collects voice information together with provision of information services to terminal devices connected via a network,
Voice information storage means for storing text data and pronunciation information of the text data in association with each other;
Voice information acquisition means for transmitting text data stored in the voice information storage means to the terminal device for display, and acquiring voice information voice-input by the terminal device for the text data;
An information service providing unit that performs voice recognition of the acquired voice information and starts providing the information service when the voice recognition result matches the pronunciation information of the transmitted text data;
The voice information acquisition means displays the text data to be collected of the voice information in the same format as the text data to be displayed on the terminal device by causing the terminal device to display the text data in parallel with the displayed text data. A voice information collection device comprising voice input requesting means for inputting voice to the text data to be collected.
前記音声入力要求手段が表示させたテキストデータに対して音声入力された音声情報を、該テキストデータと対応付けて前記音声情報記憶手段に記憶させる入力情報格納手段を更に備えた
ことを特徴とする音声情報収集装置。 The voice information collection device according to claim 1,
Voice information input by voice to the text data displayed by the voice input request means is further provided with input information storage means for storing the voice information in the voice information storage means in association with the text data. Audio information collection device.
前記テキストデータと、前記音声情報と、同一の前記音声情報を取得した回数と、を関連付けて記憶する入力候補記憶手段と、
所定の前記テキストデータおよび前記音声情報における前記回数が所定回数以上である場合に登録可能と判定する登録判定手段と、をさらに備え、
前記入力情報格納手段は、前記登録可能と判定された前記音声情報を前記テキストデータに対応付けて前記音声情報記憶手段に記憶させる
ことを特徴とする音声情報収集装置。 The voice information collection device according to claim 2,
Input candidate storage means for storing the text data, the voice information, and the number of times the same voice information has been acquired, in association with each other;
Registration determination means for determining that registration is possible when the number of times in the predetermined text data and the audio information is a predetermined number of times or more;
The voice information collection device, wherein the input information storage means stores the voice information determined to be registerable in the voice information storage means in association with the text data.
キーワード検索の検索履歴を記憶する検索履歴記憶手段をさらに備え、
前記音声入力要求手段は、
前記検索履歴に基づいて、検索率が急上昇した前記キーワードを前記検索履歴記憶手段から抽出して前記音声情報の収集対象となるテキストデータとして端末装置に表示させる
ことを特徴とする音声情報収集装置。 In the voice information collection device according to any one of claims 1 to 3,
It further comprises search history storage means for storing a search history of keyword search,
The voice input request means is
The voice information collection device, wherein the keyword whose search rate has rapidly increased based on the search history is extracted from the search history storage means and displayed on the terminal device as text data to be collected by the voice information.
前記テキストデータを画像に変換した画像データを生成する画像変換手段をさらに備えた
ことを特徴とする音声情報収集装置。 In the voice information collection device according to any one of claims 1 to 4,
An audio information collecting apparatus, further comprising image conversion means for generating image data obtained by converting the text data into an image.
前記テキストデータは、広告に関するテキストデータである
ことを特徴とする音声情報収集装置。 In the voice information collection device according to any one of claims 1 to 5,
The voice information collecting apparatus, wherein the text data is text data relating to an advertisement.
テキストデータとこのテキストデータの発音情報とを関連付けて音声情報記憶手段に記憶させ、
前記音声情報記憶手段に記憶されているテキストデータを前記端末装置に送信して表示させ、このテキストデータに対して端末装置で音声入力された音声情報を取得し、
前記取得した音声情報の音声認識を行い、その音声認識結果が前記送信したテキストデータの発音情報と一致する場合に、前記情報サービスの提供を開始し、
前記音声情報取得手段が前記端末装置に表示させるテキストデータと同一の形式によって前記音声情報の収集対象となるテキストデータを、前記表示させたテキストデータと並列に前記端末装置に表示させて、ユーザに該収集対象となるテキストデータに対して音声入力させる
ことを特徴とする音声情報収集方法。 A voice information collecting method for collecting voice information together with providing information services to terminal devices connected via a network,
The text data and the pronunciation information of the text data are associated with each other and stored in the voice information storage means,
The text data stored in the voice information storage means is transmitted to the terminal device for display, and the voice information voice-input by the terminal device is acquired for the text data,
Performing speech recognition of the acquired speech information, if the speech recognition result matches the pronunciation information of the transmitted text data, start providing the information service,
The voice information acquisition means displays the text data to be collected of the voice information in the same format as the text data to be displayed on the terminal device by causing the terminal device to display the text data in parallel with the displayed text data. A speech information collecting method, comprising: inputting voice to the text data to be collected.
ことを特徴とする音声情報収集プログラム。 A voice information collection program that causes a computer to execute the voice information collection method according to claim 7.
ことを特徴とする音声情報収集プログラム。 A voice information collecting program for causing a computer to function as the voice information collecting device according to any one of claims 1 to 6.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316921A JP4808763B2 (en) | 2008-12-12 | 2008-12-12 | Audio information collecting apparatus, method and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008316921A JP4808763B2 (en) | 2008-12-12 | 2008-12-12 | Audio information collecting apparatus, method and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010139843A true JP2010139843A (en) | 2010-06-24 |
JP4808763B2 JP4808763B2 (en) | 2011-11-02 |
Family
ID=42350026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008316921A Active JP4808763B2 (en) | 2008-12-12 | 2008-12-12 | Audio information collecting apparatus, method and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4808763B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141682A (en) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | Advertisement information providing device |
JP2016177620A (en) * | 2015-03-20 | 2016-10-06 | ヤフー株式会社 | Information processing device, information processing method, information processing program |
JP7430672B2 (en) | 2021-08-17 | 2024-02-13 | Lineヤフー株式会社 | Terminal device, transmission method, transmission program and information processing system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5734046A (en) * | 1980-07-29 | 1982-02-24 | Asahi Glass Co Ltd | Dielectric glass composition |
JP2003087860A (en) * | 2001-09-10 | 2003-03-20 | Ntt Docomo Tokai Inc | Method and system for personal identification in mobile communication, and personal identification device |
-
2008
- 2008-12-12 JP JP2008316921A patent/JP4808763B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5734046A (en) * | 1980-07-29 | 1982-02-24 | Asahi Glass Co Ltd | Dielectric glass composition |
JP2003087860A (en) * | 2001-09-10 | 2003-03-20 | Ntt Docomo Tokai Inc | Method and system for personal identification in mobile communication, and personal identification device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012141682A (en) * | 2010-12-28 | 2012-07-26 | Yahoo Japan Corp | Advertisement information providing device |
JP2016177620A (en) * | 2015-03-20 | 2016-10-06 | ヤフー株式会社 | Information processing device, information processing method, information processing program |
JP7430672B2 (en) | 2021-08-17 | 2024-02-13 | Lineヤフー株式会社 | Terminal device, transmission method, transmission program and information processing system |
Also Published As
Publication number | Publication date |
---|---|
JP4808763B2 (en) | 2011-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11315546B2 (en) | Computerized system and method for formatted transcription of multimedia content | |
US8073700B2 (en) | Retrieval and presentation of network service results for mobile device using a multimodal browser | |
CN104699784B (en) | A kind of data search method and device based on interactive mode input | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
CN107707745A (en) | Method and apparatus for extracting information | |
US20170372695A1 (en) | Information providing system | |
JP6154489B2 (en) | Terminal device, program, and server device for providing information in response to user data input | |
US10380125B2 (en) | Information processing apparatus and information processing method | |
CN118535773A (en) | Adaptive interface in voice activated networks | |
JP2009187349A (en) | Text correction support system, text correction support method and program for supporting text correction | |
JP2018045001A (en) | Voice recognition system, information processing apparatus, program, and voice recognition method | |
KR20150041592A (en) | Method for updating contact information in callee electronic device, and the electronic device | |
KR20070114530A (en) | Interactive dialog database construction method for foreign language learning, system and method of interactive service for foreign language learning using its | |
US20130332170A1 (en) | Method and system for processing content | |
JP4808763B2 (en) | Audio information collecting apparatus, method and program thereof | |
JP6179971B2 (en) | Information providing apparatus and information providing method | |
JP6233867B2 (en) | Dictionary registration system for speech recognition, speech recognition system, speech recognition service system, method and program | |
JP2013037512A (en) | Social networking service system, social networking service server, and social networking service program | |
JP2011165092A (en) | Providing device and acquisition system of document image relevant information | |
JP2005215726A (en) | Information presenting system for speaker, and program | |
JP2000076040A (en) | Voice input network terminal equipment | |
JP4825261B2 (en) | Image information collecting apparatus, method and program thereof | |
JP2005004782A (en) | Information processing system, information processor, information processing method, and personal digital assistant | |
JP2001075968A (en) | Information retrieving method and recording medium recording the same | |
JP2022018724A (en) | Information processing device, information processing method, and information processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110809 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110817 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4808763 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |