JP5814879B2 - Posted audio playback control system, posted audio playback control method, posted audio playback control program - Google Patents
Posted audio playback control system, posted audio playback control method, posted audio playback control program Download PDFInfo
- Publication number
- JP5814879B2 JP5814879B2 JP2012168740A JP2012168740A JP5814879B2 JP 5814879 B2 JP5814879 B2 JP 5814879B2 JP 2012168740 A JP2012168740 A JP 2012168740A JP 2012168740 A JP2012168740 A JP 2012168740A JP 5814879 B2 JP5814879 B2 JP 5814879B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- posted
- voice
- user
- user terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Description
本発明は、投稿音声再生制御システム、投稿音声再生制御方法、投稿音声再生制御プログラムに関するものであり、具体的には、音声SNS等のメッセージサービスにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達を可能とする技術に関する。 The present invention relates to a posted audio playback control system, a posted audio playback control method, and a posted audio playback control program. Specifically, it efficiently and efficiently selects similar posted audio in a message service such as an audio SNS, The present invention relates to a technology that enables reproduction and good transmission of poster intentions.
昨今、従来から存在するテキストベースのSNS(Social Network Service)に加え、音声メッセージの投稿、公開がなされる音声SNSが登場し、広がりを見せている。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。こうした音声SNSにおいては、投稿が音声であるが故の様々な新サービスの展開が想定される。例えば、同種の音源を同時再生する既存技術として、アナウンス音声またはバックグラウンド・ミュージックなどの音源を個別に蓄積する複数の音源ボックスからなる音声蓄積部を有し、複数の音源からの音声内容を重畳して出力することを特徴とするボイスメール音声メッセージ重畳方式(特許文献1参照)などが提案されている。 In recent years, in addition to the existing text-based SNS (Social Network Service), voice SNSs for posting and publishing voice messages have appeared and are spreading. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved. In such a voice SNS, it is assumed that various new services will be developed because the posting is voice. For example, as an existing technology for simultaneously playing back the same type of sound source, it has a sound storage unit consisting of multiple sound source boxes that individually store sound sources such as announcement sound or background music, and superimposes the sound content from multiple sound sources For example, a voice mail voice message superimposing method (see Patent Document 1) is proposed.
上述した音声SNS等のメッセージサービスにおいて、例えば、ユーザの誕生日や冠婚葬祭などの各種イベントに合わせ、該当ユーザとつながりのある多数の他ユーザが、類似した内容のメッセージを投稿する場合がある。その場合、前記ユーザは、類似内容の投稿音声を長時間繰り返し聞くことになる。一方、各投稿音声において、発話ペースやメッセージ中での特定キーワードの出現タイミングは投稿者ごとに細かく異なっている。そのため、類似内容の投稿音声らをまとめて同時再生する場合、ユーザが投稿内容を聞き取れず、投稿者側の意図がうまく伝達されない結果に終わることも懸念される。 In the message service such as the above-described voice SNS, for example, in accordance with various events such as the user's birthday and ceremonial occasion, many other users connected to the user may post messages having similar contents. . In that case, the user repeatedly listens to the posted voice with similar contents for a long time. On the other hand, in each posted voice, the utterance pace and the appearance timing of a specific keyword in a message differ finely for each poster. For this reason, there is a concern that when the posted audios having similar contents are simultaneously reproduced, the user cannot hear the posted contents and the intention of the poster side is not transmitted well.
また、ユーザが再生する他ユーザからの投稿音声は、特定のイベントに合わせて投稿されるものだけでなく、イベントに無関係な日常的なものも多く含まれる。そのため、ユーザにとっては、膨大な数の投稿音声中より、特定のイベントに関連した投稿音声のみをピックアップする非常に煩雑な作業が必要となり、投稿音声再生時の心理的な負担にもなりかねない。特に、音声SNS上において他ユーザとのつながりが多いユーザであるほど、そうした負担は大きくなり、ユーザビリティの低下が懸念される。 In addition, the posted audio from other users played by the user includes not only those posted in accordance with a specific event, but also many daily irrelevant events. Therefore, it is necessary for the user to pick up only the posted audio related to a specific event from a huge number of posted audio, which may be a psychological burden when reproducing the posted audio. . In particular, as the user has more connections with other users on the voice SNS, such a burden becomes greater, and there is a concern that usability is reduced.
そこで本発明の目的は、音声SNS等のメッセージサービスにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達を可能とする技術を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a technology that enables efficient selection and reproduction of similar posted voices in a message service such as a voice SNS without trouble and enabling good transmission of poster intentions.
上記課題を解決する本発明の投稿音声再生制御システムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブルを格納する記憶部と、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、前記同時再生対象のグループに含まれる投稿音声データにおける、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理とを実行する演算部とを備えることを特徴とする。 The posted audio reproduction control system of the present invention that solves the above problems includes a communication unit that communicates via a network with a user terminal used by a user of a social network service, event identification information, and a selection keyword that is selected in advance with respect to the event. And a storage unit that stores a determination table that associates with each other, and among the posted voice data received from the user terminal via the communication unit, the one to which the designation information of the same posting release destination is given is specified and specified Performs speech recognition processing on each posted voice data to generate text data, stores the generated text data in the storage unit for each posting publication destination, and determines each text data having a common posting publication destination against each selected keyword table, the text data contained identical selection keyword, the same Start of the process and, posts in the audio data, the same selection keyword of an audio signal included in the group of the simultaneous reproduction object to be stored in the storage unit as a specific group of co reproduced as relating draft published destination and the same event or searching the end, when the unwanted section from data head to the start point, or delete the audio signals of the unnecessary section up data end from the end, was regenerated each post audio data after the deletion execution time And a calculation unit that executes a process of transmitting data that can be output by the voice output unit to the user terminal.
また、本発明の投稿音声再生制御方法は、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブルを格納する記憶部とを備えたコンピュータが、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、前記同時再生対象のグループに含まれる、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理とを実行することを特徴とする。 In addition, the posted audio reproduction control method of the present invention corresponds to the communication unit that communicates via the network with the user terminal used by the user of the social network service, the identification information of the event, and the selection keyword selected in advance for the event. A computer having a storage unit for storing the attached determination table identifies the posted audio data received from the user terminal via the communication unit to which the same posting publication designation information is given, and Performs speech recognition processing on each identified posted voice data to generate text data, stores the generated text data in the storage unit for each posting publication destination, and each text data having a common posting publication destination. against each selected keyword of the determination table, the text data contained identical selection keywords A process of storing in the storage unit as a specific group of co reproduced as related to the same post disclosure destination and the same event, included in the group of the simultaneous reproduction object, beginning or end of the same selected keyword speech signal And delete the audio signal of the unnecessary section from the beginning of the data to the start time or the unnecessary section from the end time to the end of the data , A process of transmitting data that can be output by the output means to the user terminal is executed.
また、本発明の投稿音声再生制御プログラムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブルを格納する記憶部とを備えたコンピュータに、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、前記同時再生対象のグループに含まれる、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理とを実行させることを特徴とする。 In addition, the posted audio reproduction control program of the present invention corresponds to a communication unit that communicates with a user terminal used by a user of a social network service via a network, event identification information, and a selection keyword selected in advance for the event. A computer having a storage unit for storing the attached determination table, and identifying the post audio data received from the user terminal via the communication unit to which the same post publishing destination designation information is given, Performs speech recognition processing on each identified posted voice data to generate text data, stores the generated text data in the storage unit for each posting publication destination, and each text data having a common posting publication destination. against each selected keyword of the decision table, it contained the same selection keyword text de The data, a process of storing in the storage unit as a specific group of co reproduced as related to the same post disclosure destination and the same event, included in the group of the simultaneous playback target, the start point of the same selected keyword speech signal or searching the end, when the unwanted section from data head to the start point, or delete the audio signals of the unnecessary section up data end from the end, was regenerated each post audio data after the deletion execution time And a process of transmitting data that can be output by the voice output means to the user terminal.
本発明によれば、音声SNS等のメッセージサービスにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達が可能となる。 According to the present invention, similar posted voices in a message service such as voice SNS can be efficiently selected and played back without any trouble, and good transmission of the poster intention can be achieved.
−−−第1の実施形態におけるシステム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、第1の実施形態の投稿音声再生制御システム1002を含むネットワーク構成図である。図1に示す投稿音声再生制御システム1002(以下、システム1002)は、音声SNS等のメッセージサービスにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the first embodiment ---
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a network configuration diagram including a posted audio
なお、音声SNSとは、従来から存在するテキストベースのSNSとは異なり、音声メッセージの投稿、公開がなされるSNSである。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。 Note that the voice SNS is an SNS in which a voice message is posted and released, unlike a conventional text-based SNS. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved.
図1に例示するシステム1002は、SNSサーバ150、公開Webサーバ160、および投稿記録装置170で構成されている。SNSサーバ150は、音声SNSに関する各種処理の主たる実行主体であり、音声SNSのユーザに関する認証情報や、各ユーザの投稿音声データの情報などを管理し、ユーザ認証や投稿音声の公開、再生といった処理を実行するサーバ装置となる。また、公開Webサーバ160は、インターネット網120を介してアクセスしてくるユーザ端末200と、上述のSNSサーバ150との間にあって、SNSサーバ150でのユーザ認証処理や、上述のSNSサーバ150が出力した、投稿音声データの再生データなど各種データの授受を仲介するサーバ装置である。また、投稿記録装置170は、ユーザ端末200から送られてくる投稿音声データを格納する情報処理装置であり、SNSサーバ150からの要求に応じて、当該要求が指定する投稿音声データを読み出してSNSサーバ150に送るものとなる。
A
なお、SNSサーバ150では、ソーシャルネットワークサービスの形態として当然ながら、ユーザ毎に、当該音声SNS上でのつながり(例:友人、知人、同僚、家族、一方的なフォロワー、趣味・嗜好等のグループなど)が規定された他ユーザの情報が管理されている。従って、ユーザが再生して聞くことが出来る投稿音声は、こうしたつながりを持った他ユーザのものとなる。そのため、投稿記録装置170では、ユーザ毎に、該当ユーザ宛て乃至該当グループ宛等に投稿された他ユーザの投稿音声データを紐付けて管理している。
Of course, in the
公開Webサーバ160およびSNSサーバ150は、ユーザ端末200(投稿者端末220、閲覧再生者端末240)からのアクセスに際し、所定のユーザ認証処理を経てアクセスユーザを特定し、該当ユーザに紐付けて投稿記録装置170にて管理している他ユーザからの投稿音声データの情報(例:投稿ユーザ名、投稿日時、タイトル、録音長等)を、該当ユーザ用のページ(SNSサイトにおける、いわゆるマイページ)にて、例えば投稿日時順に列挙するように設定し、このページデータを該当ユーザ端末200に送信することとなる。
The
公開Webサーバ160が、前記のユーザ用ページにて、所定投稿についての再生指示をユーザ端末200から受けた場合、公開Webサーバ160は該当投稿に関する再生指示の情報をSNSサーバ150に送る。SNSサーバ150ではこの再生指示の情報を受けて、該当投稿に関する投稿音声データを投稿記録装置170から読み出して再生し、その再生データを公開Webサーバ160を介してユーザ端末200に送信する。ユーザ端末200では、この再生データをインターネット網120を介して受信し、スピーカーで出力する。
When the
一方、音声SNSのユーザが利用する端末がユーザ端末200である。このユーザ端末200は、例えば図1にて示すように、投稿者端末220、230、閲覧再生者端末240に分類できる。投稿者端末220は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示すると共に、自ユーザによる投稿音声の入力をマイクで受け付けて、対応する投稿音声データを公開Webサーバ160にアップロードする端末となる。また、閲覧再生者端末240は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示する端末となる。
On the other hand, the terminal used by the user of the voice SNS is the
なお、投稿者端末220、閲覧再生者端末240が公開Webサーバ160にアクセスする場合、当然ながら、音声SNSにおける自分用のページにログインするためのユーザ認証処理が必要となる。従って、投稿者端末220、閲覧再生者端末240では、利用中のユーザによる認証情報の入力を受け付けて、これを認証依頼と共に、公開Webサーバ160を介してSNSサーバ150に送信する。この場合、SNSサーバ150は、前記の認証情報を、認証用の情報を格納したデータベース等に照合してユーザ認証を実行し、その認証結果に応じて、該当投稿者端末220や閲覧再生者端末240からの公開Webサーバ160における該当ユーザ用ページへのアクセス可否を制御する。また、SNSサーバ150は、前記の認証結果を公開Webサーバ160を介して投稿者端末220や閲覧再生者端末240に送信する。
In addition, when the
また、上述したように、投稿音声データやその再生データの授受等をインターネット網120を介して行う場合の他に、ユーザ端末200の電話機能と、公衆回線網122らを用いて投稿音声データやその再生データの授受等を行う形態も想定できる。この場合、図1にて示すように、上述のSNSサーバ150や投稿記録装置170にLAN回線121を介して接続する電話応答システム300がネットワーク構成に含まれる。
Further, as described above, in addition to the case where the posting voice data and its reproduction data are exchanged via the
この電話応答システム300は、交換機310、自動音声応答装置320、CTI(Computer Telephony Integration)装置330から構成されている。そのうち交換機310は、電話回線を相互接続し電話網を構成するための交換機であり、自動音声応答装置320は、電話の応答と音声による情報の入出力や対話をコンピュータにて行う装置であり、CTI装置330は、電話やFAXをコンピュータシステムに統合する装置である。
The
こうした構成において、ユーザ端末たる投稿者端末230より、予め定められた投稿受付電話番号へ発話がなされた場合、上述の投稿者端末230は、公衆回線網122を経て交換機310へ接続され、この接続に応じて、CTI装置330での発話番号取得や自動応答装置320での自動音声ガイダンス再生がなされる。その後、上述の投稿者端末230において、投稿者がメッセージを発話した場合、その発話メッセージは自動音声応答装置320を経て、投稿音声データとして投稿記録装置170に録音、すなわち登録される。また、この投稿音声データの登録処理にあわせ、自動音声応答装置320が、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を、SNSサーバ150に通知する。SNSサーバ150では、この通知を受けて、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を記憶部に格納することとなる。
In such a configuration, when an utterance is made from a contributor terminal 230, which is a user terminal, to a predetermined post acceptance telephone number, the contributor terminal 230 is connected to the
続いて、システム1002のハードウェア構成について説明する。第1の実施形態におけるシステム1002は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。まずは、システム1002における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1002を構成するSNSサーバ150は、図2に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第1の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブル130が少なくとも記憶されている。
In this case, as illustrated in FIG. 2, the
また、公開Webサーバ160も同様に、図3に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部111、RAMなど揮発性記憶装置で構成されるメモリ113、前記記憶部111に保持されるプログラム112をメモリ113に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部114、インターネット網120、LAN回線121と接続し他装置との通信処理を担う通信部115、を備える。なお、記憶部111内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム112、および、音声SNSサイトの各種Webページデータ116が少なくとも記憶されている。
Similarly, as illustrated in FIG. 3, the
また、投稿記録装置170も同様に、図4に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部11、RAMなど揮発性記憶装置で構成されるメモリ13、前記記憶部11に保持されるプログラム12をメモリ13に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部14、LAN121と接続し他装置との通信処理を担う通信部15、を備える。なお、記憶部11内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム12、および、各ユーザ端末200(投稿者端末220、230)から受信した投稿音声データ16が少なくとも記憶されている。投稿音声データ16には、各投稿音声データのファイル(ファイル名が識別情報ともなる)と、該当投稿音声の投稿者、投稿日時、および公開先といったデータが対応付けて格納されている(図4)。
Similarly, as illustrated in FIG. 4, the posting
続いて、第1の実施形態のシステム1002が備える機能について説明する。第1の実施形態におけるシステム1002は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1002として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1002において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Next, functions provided in the
この場合、システム1002は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する機能を有している。
In this case, the
また、システム1002は、上述で得た投稿公開先が共通な各テキストデータを判定テーブル130の各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、同時再生対象のグループとして記憶部に格納する機能を有している。
Further, the
また、システム1002は、上述の同期再生対象のグループに含まれる投稿音声データにおける、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索し、データ先頭から開始時点までの不要区間、ないし終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信する機能を有している。
Further, the
また、システム1002は、上述の削除実行後の各投稿音声データを、データ先頭から同時に再生したデータをユーザ端末200に送信するとしてもよい。或いは、システム1002は、削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータをユーザ端末200に送信するとしてもよい。
In addition, the
また、システム1002は、上述の削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速で再生し、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速で再生して、各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信するとしてもよい。
Further, the
−−−第1の実施形態におけるデータ構造例−−−
次に、第1の実施形態のシステム1002が用いるテーブルにおけるデータ構造例について説明する。図5は、第1の実施形態における判定テーブル130の一例を示す図である。判定テーブル130は、「結婚」、「誕生日」、「合格」といった各種イベントの識別情報をキーに、該当イベントに関して予め選定された、「けっこんおめでとう」、「たんじょうびおめでとう」、「ハッピーウェデング」といった選定キーワードを対応付けたレコードの集合体となっている。
--- Example of data structure in the first embodiment ---
Next, an example of a data structure in a table used by the
−−−第1の実施形態における処理手順例−−−
以下、第1の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1002を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the first embodiment ---
Hereinafter, the actual procedure of the posted audio reproduction control method in the first embodiment will be described with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read into the memory and executed by each device constituting the
図6は、第1の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定する(s100)。
FIG. 6 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the first embodiment. Here, the
次に、SNSサーバ150は、上述で特定した投稿音声データそれぞれに対し、プログラム102が含む音声認識プログラムを呼び出して実行して音声認識処理を実行し(s101)、テキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する(s102)。
Next, the
ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、判定テーブル130における各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、合成再生対象グループとして記憶部101に記憶する(s103)。SNSサーバ150は、このステップs103の処理を、上述のステップs102で得ている各投稿音声データについて全て実行する(s104)。こうした処理により、例えば、あるユーザ「U00001」を公開先とし、「けっこんおめでとう」という選定キーワードを共通に含んでいた投稿音声データが特定されたとする。図5に示す判定テーブル130の例であれば、この場合の投稿音声データのテーマは、イベント「結婚祝い」となる。また、図12に第1の実施形態における処理結果例を示す。この例では、「投稿1」、「投稿4」、「投稿7」、が、投稿公開先「太郎」、およびイベント「誕生祝い」について共通する投稿音声データとして特定されている。
Here, the
続いてSNSサーバ150は、上述のステップs103にて特定した、投稿公開先およびイベントが共通する各投稿音声データにおいて、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索する(s105)。上述の例であれば、SNSサーバ150は、前記各投稿音声データについて、「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定する。この音声解析処理は、SNSサーバ150が備えるプログラム102が備える音声解析プログラムを実行することで実行される。なお、音声解析プログラムは既存のものを利用すればよい。
Subsequently, the
「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定したSNSサーバ150は、図7に例示する如く、該当投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、ないし上述の発話終了時点から投稿音声データにおけるデータ末尾までの不要区間Δt2、のいずれかの音声信号を削除する(s106)。SNSサーバ150は、このステップs106の処理を、上述のステップs105で開始時点ないし終了時点を検索した各投稿音声データについて全て実行する(s107)。
The
次に、SNSサーバ150は、上述のステップs106での不要区間削除の実行後、各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとし(s108)、当該ファイルを再生した再生データをユーザ端末200に送信する(s109)。このように、各投稿音声データをデータ先頭から重畳させることで合成して1ファイルとし、当該ファイルを再生することで、各投稿音声データの同時再生がなされることになる。図8に第1の実施形態の合成再生用ファイルの例1を示す。この図8にて示すように、前記のステップs108で合成して得たファイル、すなわち合成再生用ファイルは、各投稿者の投稿音声データが「けっこんおめでとう」の部分を先頭に多重化されたものとなっている。
Next, after executing the unnecessary section deletion in step s106 described above, the
なお、SNSサーバ150は、不要区間削除の実行後、上述のステップs108において、各投稿音声データを、同時に再生終了となるようデータ末尾を揃えて重畳させることで合成して1ファイルとし、前記ステップs109において、当該ファイルを再生した再生データをユーザ端末200に送信するとしてもよい。図9に第1の実施形態の合成再生用ファイルの例2を示す。この場合の合成再生用ファイルは、図9にて示すように、各投稿者の投稿音声データが、「けっこんおめでとう」の部分を後端に揃えて多重化されたものとなっている。
In addition, after execution of unnecessary section deletion, the
上述した例では、投稿音声データのうち、不要区間として削除するのは、データ先頭から選定キーワードの発話開始時点まで、或いは選定キーワードの発話終了時点からデータ末尾まで、としたが、その他にも、図10に示すように、第1の選定キーワードの発話終了時点から、第2の選定キーワードの発話開始時点までの不要区間Δt3を想定するとしてもよい。この場合、SNSサーバ150は、例えば、処理対象の各投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt1,Δt3の削除実行後の各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとする(図11)。或いは、SNSサーバ150は、例えば、処理対象の各投稿音声データにおける上述の発話終了時点からデータ末尾までの不要区間Δt2、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt2,Δt3の削除実行後の各投稿音声データを、データ末尾が揃うよう重畳させることで合成して1ファイルとするとしてもよい。
In the above-described example, the post audio data is deleted as an unnecessary section from the beginning of the data to the start time of the utterance of the selected keyword or from the end time of the utterance of the selected keyword to the end of the data. As shown in FIG. 10, an unnecessary section Δt3 from the time when the utterance of the first selected keyword is ended to the time when the utterance of the second selected keyword is started may be assumed. In this case, for example, the
なお、上述のステップs106において、不要区間の削除を行って得られた投稿音声データの再生時間長が、各投稿音声データ間で大きく異なっているとすれば、上述の合成再生用ファイルを生成して再生したとしても、それを聞いているユーザは発話タイミングがばらばらにずれた内容のメッセージを聞くことになりかねない。 If the playback time length of the posted audio data obtained by deleting the unnecessary section in step s106 is greatly different between the posted audio data, the above-described synthetic playback file is generated. Even if it is played back, the user who listens to it may hear a message whose content is different from the timing of the utterance.
そこで、SNSサーバ150は、上述のステップs108において、不要区間削除実行後の各投稿音声データを重畳させる際、不要区間削除実行後の各投稿音声データ間での再生時間長の平均値を算定し(s108A)、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速の再生速度、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速の再生速度を設定し、各投稿音声データの再生時間長を統一する処理を実行する(s108B)。SNSサーバ150は、当該処理後の各投稿音声データを合成して1ファイルとする。
Therefore, the
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
こうした本実施形態によれば、音声SNSにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達が可能となる。 According to the present embodiment, it is possible to efficiently select and reproduce similar posted voices in the voice SNS without trouble and to transmit the poster intentions well.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第1の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、データ先頭から同時に再生したデータを前記ユーザ端末に送信するものであるとしてもよい。 At least the following will be clarified by the description of the present specification. That is, in the posted sound reproduction control system according to the first embodiment, the calculation unit may transmit data obtained by simultaneously reproducing each posted sound data after the deletion execution from the top of the data to the user terminal. Good.
また、第1の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータを前記ユーザ端末に送信するものであるとしてもよい。 Further, in the posted sound reproduction control system according to the first embodiment, the calculation unit transmits data reproduced by aligning the end of the data so that the posted sound data after the deletion is finished at the same time. It may be a thing.
また、第1の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、前記各投稿音声データのうち再生時間長が前記平均値に満たないものは基準速度より低速の再生速度を設定し、前記各投稿音声データのうち再生時間長が前記平均値を越えるものは基準速度より高速の再生速度を設定して、前記各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、前記ユーザ端末に送信するものであるとしてもよい。 Further, in the posted audio reproduction control system according to the first embodiment, the calculation unit calculates an average value of reproduction time lengths between the respective post audio data after the execution of the deletion, and reproduces among the posted audio data. If the time length is less than the average value, a playback speed lower than the reference speed is set, and among the posted audio data, if the playback time length exceeds the average value, a playback speed higher than the reference speed is set. Then, a process for unifying the playback time length of each posted audio data may be executed, and data obtained by simultaneously reproducing each posted audio data after the processing may be transmitted to the user terminal.
−−−第2の実施形態におけるシステム構成−−−
以下に本発明の第2の実施形態について図面を用いて詳細に説明する。第2の実施形態の音楽選択支援システム1001を含むネットワーク構成は、第1の実施形態のネットワーク構成(図1)と同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第2の実施形態における音楽選択支援システム1001(以下、システム1001)は、音声SNS(Social Network Service)での投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図るコンピュータシステムである。
--- System configuration in the second embodiment ---
Hereinafter, a second embodiment of the present invention will be described in detail with reference to the drawings. The network configuration including the music
続いてシステム1001のハードウェア構成について説明する。第2の実施形態におけるシステム1001は、第1の実施形態と同様、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。ここでは、システム1001における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1001を構成するSNSサーバ150は、図13に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第2の実施形態の音楽選択支援システムとして必要な機能を実装する為のプログラム102、評価テーブル125、ユーザテーブル128、および、投稿音声データ情報テーブル129が少なくとも記憶されている。なお、評価テーブル125は、一次評価テーブル126と二次評価テーブル127から構成されている。
In this case, as illustrated in FIG. 13, the
続いて、第2の実施形態のシステム1001が備える機能について説明する。第2の実施形態におけるシステム1001は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1001として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1001において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Next, functions provided in the
この場合、システム100は、ユーザ端末200から受信した投稿音声データ(投稿記録装置170で格納されているもの)に対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する機能を有している。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。
In this case, the
また、システム1001は、上述の音声認識処理で生成したテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有している。他方、ユーザ端末200では、この推奨情報を受信してディスプレイにて表示し、ユーザに閲覧させる。ここでシステム1001は、前記選定キーワード群を特定するに際し、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定するとしてもよい。
Further, the
ユーザが上述の推奨情報の示す音楽を容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。SNSサーバ150は、容認通知を受信した音楽のデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信することとなる。或いは、上述の如き、システム1001は、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
When the user accepts the music indicated by the recommended information, the
また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を複数特定した場合、例えば、マッチ度最高のものが並存していた場合、ユーザ端末200のユーザに関する属性情報をユーザテーブル128より読み出し、ユーザの属性情報を評価テーブル125の各ユーザ属性に照合して、ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。当然この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
Further, when the
また、システム1001は、マッチ度が最も高い選定キーワード群を複数特定した場合に、該当投稿音声データに、ソーシャルネットワークサービスにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する機能を有しているとしてもよい。
Further, the
この場合、システム1001は、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合、該当指定情報が示す投稿公開先のユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿公開先のユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In this case, when the
一方、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合、システム1001は、該当投稿音声データの投稿ユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する処理を実行するものとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
On the other hand, as a result of the determination, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data, the
また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近の投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、該当投稿音声データに対し、上述同様の音声認識処理を実行してテキストデータを生成し、当該テキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In addition, when the
また、システム1001は、上述のテキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近から所定範囲の期間の各投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出し、当該キーワードを評価テーブル125の各選定キーワード群に照合して、出現頻度一定以上のキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In addition, when the
−−−第2の実施形態におけるデータ構造例−−−
次に、第2の実施形態のシステム1001が用いるテーブルにおけるデータ構造例について説明する。図14は第2の実施形態の評価テーブル125の一例を示す図である。評価テーブル125は、音楽データの識別情報と該当音楽データに関して予め選定された選定キーワード群とを対応付けたテーブルであり、第2の実施形態では、一次評価テーブル126と二次評価テーブル127とで構成している。図に示す例では、一次評価テーブル126は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定された、「たんじょうび」、「ばーすでい」、「はっぴー」、などといった選定キーワード群とを対応付けたレコードの集合体となっている。また、二次評価テーブル127は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定されたユーザ属性(例:誕生日当日、ロック音楽好き、40代)、および直近書込みが含むキーワード(例:結婚、クリスマス等)を対応付けたレコードの集合体となっている。
--- Example of data structure in the second embodiment ---
Next, an example of a data structure in a table used by the
図15は第2の実施形態のユーザテーブル128の一例を示す図である。ユーザテーブル128は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。 FIG. 15 is a diagram illustrating an example of the user table 128 according to the second embodiment. The user table 128 is a table in which attribute information of each user of the voice SNS is described. In the example of the figure, the user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user are associated with the user ID as a key. It is a collection of attached records.
図16は第2の実施形態の投稿音声データ情報テーブル129の一例を示す図である。投稿音声データ情報テーブル129は、投稿記録装置170に格納されている投稿音声データに関する情報を、該当投稿音声データの公開先毎に格納したテーブルであり、図の例では、「U00001」といったユーザID毎に、投稿音声データIDをキーとして、該当投稿音声データの投稿者、投稿日時、投稿音声データのタイトル(識別情報)といった値を対応付けたレコードの集合体となっている。
FIG. 16 is a diagram illustrating an example of the posted audio data information table 129 according to the second embodiment. The posted audio data information table 129 is a table in which information related to posted audio data stored in the posting
−−−第2の実施形態における処理手順例−−−
以下、第2の実施形態における音楽選択支援方法の実際手順について図に基づき説明する。以下で説明する音楽選択支援方法に対応する各種動作は、システム1001を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the second embodiment ---
Hereinafter, the actual procedure of the music selection support method in the second embodiment will be described with reference to the drawings. Various operations corresponding to the music selection support method described below are realized by programs that are read into the memory and executed by the devices constituting the
図17は、第2の実施形態における音楽選択支援方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信して投稿記録装置170に格納された投稿音声データを、投稿記録装置170より取得する(s200)。
FIG. 17 is a flowchart illustrating a processing procedure example of the music selection support method according to the second embodiment. Here, the
次に、SNSサーバ150は、上述で取得した投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s201)。ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、一次評価テーブル126における、各BGMの選定キーワード群に照合して、テキストデータが含むキーワードと各BGMとのマッチ度を算定する(s202)。
Next, the
このように、テキストデータが含むキーワードと各BGMとのマッチ度を算定する処理は、例えば次のような処理手順となる。テキストデータが含むキーワードが、「けっこん」、「おめでとう」、「しあわせ」であった場合、SNSサーバ150は、これらキーワードを一次評価テーブル126に照合し、「けっこん」のキーワードについては、適合時得点の「10点」を特定し、「おめでとう」のキーワードについては、適合時得点の「6点」を特定し、「しあわせ」のキーワードについては、適合時得点の「6点」を特定する。こうした、「けっこん」、「おめでとう」、「しあわせ」の各キーワードに関する適合時得点の特定処理を、一次評価テーブル126における各BGMのレコードについて実行し(s203)、図18に示す評価結果例1のように、各BGM毎の得点計を算定する。図18の例では、"BGM2:ウェディングソング"について最高得点「19点」が算定された。
As described above, the process for calculating the degree of matching between the keyword included in the text data and each BGM is, for example, the following processing procedure. When the keywords included in the text data are “Kekkon”, “Congratulations”, and “Happiness”, the
このように、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが1つのみ特定された場合(s204:No)、SNSサーバ150は、特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者或いは公開先として指定されている他ユーザのユーザ端末200に送信する(s205)。該当投稿音声データの投稿者情報は勿論のこと、公開先は、投稿音声データの投稿時に投稿者が指定しており、公開先となったユーザないしグループの情報が該当投稿音声データに付帯して投稿記録装置170や投稿音声データ情報テーブル129に格納されているものとする。
As described above, only the keyword with the highest degree of matching with the keyword included in the text data, that is, the keyword group with the highest score = BGM is specified by the matching of the keyword of the text data to the primary evaluation table 126 and the score calculation process. If it is found (s204: No), the
なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。
Note that the
SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。なお、SNSサーバ150は、上述の如き、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応するBGMのデータを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信するとしてもよい。
The
一方、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが複数特定された場合(s204:Yes)、SNSサーバ150は、該当投稿音声データに、音声SNSにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する(s206)。
On the other hand, when the matching of the keywords of the text data to the primary evaluation table 126 and the score calculation process specify a plurality of keywords having the highest degree of matching with the keywords included in the text data, that is, the highest score keyword group = BGM (s204). : Yes), the
この場合、SNSサーバ150は、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合(s206:Yes)、該当指定情報が示す「投稿公開先」のユーザに関して、ユーザテーブル128から属性情報を読み出す(s207)。このステップs207において、SNSサーバ150は、更に、「投稿公開先」のユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。
In this case, if the
他方、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合(s206:No)、SNSサーバ150は、該当投稿音声データの「投稿」ユーザに関して、ユーザテーブル128から属性情報を読み出す(s208)。このステップs208において、SNSサーバ150は、更に、「投稿」ユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。
On the other hand, as a result of the determination in the above-described step s206, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data (s206: No), the
続いてSNSサーバ150は、上述のステップs207、s208のいずれかで得た、ユーザの属性情報および直近書込みから得たキーワードを、二次評価テーブル127に照合し、各BGMに関して規定されているユーザの属性情報およびキーワードとのマッチ度を算定する(s209)。
Subsequently, the
このように、ユーザの属性情報およびキーワードと、各BGMとのマッチを算定する処理は、例えば次のような処理手順となる。ユーザの属性情報が「年齢:40」、「音楽志向:ロック」であり、キーワードが、「フットサル」、「がんばろう」であった場合、SNSサーバ150は、これらの値を二次評価テーブル127に照合し、「年齢:40」、「音楽志向:ロック」の各値については適合時得点の「10点」をそれぞれ特定し、「フットサル」、「がんばろう」の各キーワードについては、適合時得点無しを特定する。こうした、ユーザの属性情報およびキーワードに関する適合時得点の特定処理を、二次評価テーブル127における各BGMのレコードについて実行し(s210)、図19に示す評価結果例2のように、各BGM毎の得点計を算定する。
As described above, the process for calculating the match between the user attribute information and the keyword and each BGM is, for example, the following processing procedure. When the attribute information of the user is “age: 40”, “music-oriented: rock”, and the keywords are “futsal” and “good luck”, the
図19の例では、一次評価テーブル126を用いた評価で最高得点となった"BGM4"、"BGM5"、"BGM6"、のうち、二次評価テーブル127を用いた評価で、"BGM6"に計20点が算定された。このように、二次評価テーブル127へのユーザの属性情報およびキーワードの照合と得点算定の処理により、ユーザの属性情報およびキーワードとのマッチ度最高のもの、つまり最高得点のBGMを特定する。 In the example of FIG. 19, the evaluation using the secondary evaluation table 127 among “BGM4”, “BGM5”, and “BGM6” that has the highest score in the evaluation using the primary evaluation table 126 is changed to “BGM6”. A total of 20 points were calculated. In this way, by matching the user attribute information and keywords to the secondary evaluation table 127 and processing for score calculation, the BGM having the highest degree of match with the user attribute information and keywords, that is, the highest score BGM is specified.
続いてSNSサーバ150は、上述のステップs205と同様に、上述のステップs209で特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者のユーザ端末200に送信する(s211)。なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。
Subsequently, as in step s205 described above, the
SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。
The
こうした第2の実施形態によれば、音声SNSでの投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図ることが可能となる。 According to such 2nd Embodiment, it becomes possible to select music efficiently with respect to the contribution sound | voice by audio | voice SNS, and, by extension, the usability improvement by audio | voice SNS can be aimed at.
−−−第3の実施形態におけるシステム構成−−−
以下に本発明の第3の実施形態について図面を用いて詳細に説明する。第3の実施形態の投稿音声再生制御システム1003を含むネットワーク構成は、第1、第2の実施形態のネットワーク構成(図1)と同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第3の実施形態における投稿音声再生制御システム1003(以下、システム1003)は、音声SNSにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the third embodiment ---
Hereinafter, a third embodiment of the present invention will be described in detail with reference to the drawings. The network configuration including the posted audio
続いてシステム1003のハードウェア構成について説明する。第3の実施形態におけるシステム1003は、第1の実施形態と同様、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。ここでは、システム1003における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1003を構成するSNSサーバ150は、図20に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第3の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、グルーピングテーブル131、優先度評価テーブル132、およびユーザテーブル133が少なくとも記憶されている。これらテーブルの詳細については後述する。
In this case, as illustrated in FIG. 20, the
なお特に図示しないが、投稿記録装置170が、記憶部11において格納している投稿音声データ16には、該当投稿音声データと共に再生するBGMの識別情報のデータが対応付けられている。
Although not particularly illustrated, the posted
続いて、第3の実施形態のシステム1003が備える機能について説明する。第3の実施形態におけるシステム1003は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1003として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1003において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Next, functions provided in the
この場合、システム1003は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データのうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定し、該当投稿音声データに同時再生すべき音楽が付与されている場合は、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を、一方、該当投稿音声データに同時再生すべき音楽が付与されていない場合は、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部101に格納する機能を有している。
In this case, the
また、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を有している。
In addition, the
なお、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出し、このユーザの属性情報を優先度評価テーブル132に照合して、ユーザの属性情報に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。
Note that the
また、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データ16を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを優先度評価テーブル132に照合して、ユーザの投稿内容に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。
In addition, the
なお、システム1003は、上述の投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを記憶部101にて設定する機能を備えるとしてもよい。この場合、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生する際、上述のフラグが設定されているテーマに対応した連続再生対象のグループについては再生をせず、他の連続再生対象のグループの再生を優先する。
In addition, when the
−−−第3の実施形態におけるデータ構造例−−−
次に、第3の実施形態のシステム1003が用いるテーブルにおけるデータ構造例について説明する。図21は、第3の実施形態のグルーピングテーブル131の一例を示す図である。このグルーピングテーブル131は、「バースデイソング」、「ウェディングソング」といったBGM名、すなわち音楽データの識別情報をキーとして、投稿音声を音声認識により生成したテキストキーワード、「お祝い系」、「元気系」といった該当音楽または投稿音声のテーマ、および「楽しい」、「明るい」といったトーン(曲調)とを対応付けたレコードの集合体となっている。
--- Example of data structure in the third embodiment ---
Next, an example of a data structure in a table used by the
図22は第3の実施形態の優先度評価テーブル132の一例を示す図である。また、優先度評価テーブル132は、ユーザの属性情報(例:誕生日等)ないし投稿内容(例:結婚、試合等)と、連続再生対象の再生優先レベルとを対応付けたレコードの集合体となっている。図22における優先度評価テーブル132の例では、連続再生対象のグループの公開先であるユーザの属性情報(例:誕生日等)ないし直近の投稿内容(例:結婚、試合等)が、当該優先度評価テーブル132におけるユーザ属性ないし投稿内容の項目値にマッチした場合、該当連続再生対象のグループに付与される所定の評価得点の値が規定されたテーブルとなっている。 FIG. 22 is a diagram illustrating an example of the priority evaluation table 132 according to the third embodiment. In addition, the priority evaluation table 132 includes a collection of records in which user attribute information (eg, birthday, etc.) or post content (eg, marriage, match, etc.) is associated with a playback priority level to be continuously played back. It has become. In the example of the priority evaluation table 132 in FIG. 22, the attribute information (eg, birthday) of the user who is the disclosure destination of the group to be continuously played or the latest posted content (eg, marriage, match, etc.) This table defines a predetermined evaluation score value to be given to the group to be subjected to continuous reproduction when the user attribute or the post content item value in the degree evaluation table 132 is matched.
図23は第3の実施形態のユーザテーブル133の一例を示す図である。また、ユーザテーブル133は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。 FIG. 23 is a diagram illustrating an example of the user table 133 according to the third embodiment. Further, the user table 133 is a table describing attribute information of each user of the voice SNS. In the example of the figure, user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user using the user ID as a key. It is a collection of records that correspond to each other.
−−−第3の実施形態における処理手順例−−−
以下、第3の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1003を構成する各装置らがメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the third embodiment ---
The actual procedure of the posted audio reproduction control method in the third embodiment will be described below with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read out from a memory or the like and executed by each device constituting the
図24は、第3の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データ16のうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定する(s300)。
FIG. 24 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the third embodiment. Here, the
また、SNSサーバ150は、上述のステップs300で特定された当該投稿音声データに同時再生すべき音楽が付与されているか否かを判定し(s301)、付与されている場合、特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報をグルーピングテーブル131に照合して、各投稿音声データと同時再生すべき音楽のテーマ(例:誕生日祝い、結婚祝い等)やトーンを特定する(s302)。この場合、SNSサーバ150は、投稿記録装置170にて該当投稿音声データ16に関して付与されている、「バースデイソング」といったBGMの識別情報を読み取り、当該BGMの識別情報をグルーピングテーブル131に照合して、該当投稿音声データと同時再生すべき音楽のテーマを「お祝い系」、トーンを「楽しい・明るい」などと特定することになる。なお、各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報は、後述する第2の実施形態における音楽選択支援システム1001により特定され、投稿記録装置170にて投稿音声データに付与されたものであると想定する。
In addition, the
また、上述のステップs300で特定された当該投稿音声データに同時再生すべき音楽が付与されていない場合、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定する(s303)。 If the music to be played back simultaneously is not given to the posted audio data specified in step s300 described above, a speech recognition process is performed on each of the specified posted audio data to generate text data, The generated text data is collated with the grouping table 131, and the theme (for example, birthday celebration, wedding celebration, etc.) of each posted audio data is specified (s303).
続いてSNSサーバ150は、上述のステップs302またはs303で特定したテーマ、好ましくは更にトーンも互いに共通する投稿音声データらを、連続再生対象のグループとして記憶部101に格納する(s304)。SNSサーバ150における、この投稿音声データのグルーピングの処理は、上述のステップs300で特定した全ての投稿音声データに関して処理完了するまで繰り返し実行することとなる(s305)。図25に示す評価結果例では、同一公開先の投稿音声データとして、「投稿1」〜「投稿7」までの7つの投稿が特定され、それら各投稿に紐付けされていたBGMの識別情報が「BGM1:バースデイソング」、「BGM2:応援歌」、「BGM3:卒業ソング」、「BGM4:バースデイソング」、「BGM5:卒業ソング」、「BGM6:バレンタインソング」、「BGM7:BGMなし」であり、それらのテーマに基づくグループは、「投稿1:お祝い系」、「投稿2:元気系」、「投稿3:お別れ系」、「投稿4:お祝い系」、「投稿5:お別れ系」、「投稿6:お祝い系」、「投稿7:お祝い系」と分類された。
Subsequently, the
次に、SNSサーバ150は、上述の連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出す(s306)。また、SNSサーバ150は、前記グループにおける投稿公開先のユーザに関する直近の投稿音声データ16(直近から一定期間遡った複数件であってもよい)を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s307)。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。
Next, the
SNSサーバ150は、上述のステップs306,s307で得た、前記ユーザの属性情報およびテキストデータ(すなわち直近の投稿内容)を、優先度評価テーブル132に照合し、これらユーザの属性情報および直近の投稿内容に応じて、該当グループの再生優先レベルを特定する(s308)。
The
図25に示す評価結果例の場合、投稿公開先のユーザの属性情報が、「誕生日:2月」であり、また、当該ユーザによる直近の投稿内容が「明日はサッカーの試合のあと、誕生日パーティだ!」、「週末はバレンタイン」、「来月で卒業。さみしいなあ」であった。そのため、「投稿1」〜「投稿7」の各投稿のうち、「投稿1」については、その投稿内容が「7歳の誕生日おめでとう」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿2」については、その投稿内容が「明日の試合がんばろう」であるから、"試合"なるキーワードについて「10点」獲得し、該当グループの「元気系」にこの10点を加算する。また、「投稿3」については、その投稿内容が「もうすぐ卒業式、高校は別々で寂しいね」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿4」については、その投稿内容が「ハッピーバースディ。もう7才。大きくなったね」であるから、"バースデイ"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿5」については、その投稿内容が「卒業してもまたみんなで遊ぼう」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿6」については、その投稿内容が「バレンタインチョコ作りで忙しいよう」であるから、"バレンタイン"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿7」については、その投稿内容が「今日の誕生日会はみんなにお祝いしてもらって楽しかった」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。
In the case of the evaluation result example shown in FIG. 25, the attribute information of the posting release destination user is “birthday: February”, and the latest posted content by the user is “birth tomorrow after a soccer game, "It was a party!", "Valentine on the weekend", "Graduated next month. Therefore, among the posts from “
各グループの得点は、「投稿1」、「投稿4」、「投稿6」、「投稿7」から10点ずつ得たお祝い系が合計40点となり、「投稿2」からのみ10点得た元気計が合計10点となり、「投稿3」、「投稿5」から10点づつ得たお別れ系が合計20点となった。従って、SNSサーバ150は、こうして得た各グループの総得点が高いものほど、再生優先レベルが高いと判定し、これに応じてグループ間の再生順序を、再生順序1位:お祝い系、再生順序2位:お別れ系、再生順序3位:元気系、と決定する(s309)。
The score of each group is 40 points in total for 10 points from “
続いてSNSサーバ150は、上述のステップs309で決定した再生順序で、該当連続再生対象のグループを、投稿記録装置170(ないし投稿記録装置170から投稿音声データをコピーした記憶部101)より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する(s310)。
Subsequently, the
なお、SNSサーバ150は、上述のステップs310における投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合(s311:Yes)、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを、記憶部101にて設定するとしてもよい(s312)。このステップs312の処理後のSNSサーバ150は、後に、ステップs310を再度実行するに際し、上述のフラグが設定されているテーマに対応した連続再生対象のグループについて、該当フラグの示す有効期間内の間は、再生をせず、他の連続再生対象のグループのうち再生順序が早いものから再生を優先する。このような処理を行うこととすれば、システム1003側で決定した再生順序を、ユーザが好ましく思わなかった事実を確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。
Note that the
また、SNSサーバ150は、上述のフラグの起源である再生停止指示を行ったユーザ毎に、前記フラグの設定履歴を該当グループと対応付けて記憶部101にて保持しておくとしてもよい。この場合、SNSサーバ150は、該当ユーザに関して、各グループでのフラグ設定頻度を一定期間毎に算定し、グループ間でフラグ設定頻度が最高となったものについて、以後再びフラグが設定される際には、フラグの有効期間すなわち再生対象排除の期間を通常より一定期間延長するといった処理を実行する。このような処理を行うこととすれば、ユーザが好ましく思わなかった事実を更に確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。
The
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
こうした第3の実施形態によれば、音声SNSにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達が可能となる。 According to the third embodiment, a plurality of posted voices in the voice SNS can be continuously reproduced without a sense of incongruity, and a good transmission of the poster intention can be achieved.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第3の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの属性情報と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記優先度評価テーブルに照合して、前記ユーザの属性情報に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。 At least the following will be clarified by the description of the present specification. That is, in the posted audio reproduction control system according to the third embodiment, the storage unit includes a user table describing attribute information of each user of the social network service, user attribute information, and a reproduction priority level to be continuously reproduced. An associated priority evaluation table, wherein the calculation unit reads attribute information related to a posting release destination user in the group to be continuously reproduced from the user table, and the attribute information of the user is read from the priority evaluation table. The playback priority level of the group according to the attribute information of the user is determined, the playback order between the groups is determined according to the level of the playback priority level, and the continuous playback target in the playback order is determined. Read the group from the storage unit, play each post audio data included in the group sequentially, Data is the one that transmits to the user terminal may be.
また、第3の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、各ユーザ端末から受信した投稿音声データを蓄積しているものであり、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの投稿内容と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記優先度評価テーブルに照合して、前記ユーザの投稿内容に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。 In the posted audio playback control system according to the third embodiment, the storage unit stores posted audio data received from each user terminal, and describes attribute information of each user of the social network service. A user table, and a priority evaluation table that associates the user's posted content with the playback priority level of the continuous playback target, and the calculation unit includes the latest user related post posting destination in the group of the continuous playback target Read the posted voice data from the storage unit, execute voice recognition processing on the corresponding posted voice data to generate text data, check the text data against the priority evaluation table, and according to the user's posted content The playback priority level of the group is specified, and the playback order between groups is determined according to the level of the playback priority level. The continuous playback target group is read from the storage unit in the playback order, each posted audio data included in the group is sequentially played back, and the played back data is transmitted to the user terminal. Good.
1001 音楽選択支援システム(第2の実施形態)
1002 投稿音声再生制御システム(第1の実施形態)
1003 投稿音声再生制御システム(第3の実施形態)
11、101、111 記憶部
12、102、112 プログラム
13、103、113 メモリ
14、104、114 演算部
15、105、115 通信部
16 投稿音声データ
120 インターネット網(ネットワーク)
121 LAN回線(ネットワーク)
122 公衆回線網(ネットワーク)
125 評価テーブル
126 一次評価テーブル
127 二次評価テーブル
128 ユーザテーブル
129 投稿音声データ情報テーブル
130 判定テーブル
131 グルーピングテーブル
132 優先度評価テーブル
133 ユーザテーブル
150 SNSサーバ
160 公開Webサーバ
170 投稿記録装置
200 ユーザ端末
220、230 投稿者端末(ユーザ端末)
240 閲覧再生者端末(ユーザ端末)
300 電話応答システム
310 交換機
320 自動音声応答装置
330 CTI装置
1001 Music selection support system (second embodiment)
1002 Posted audio playback control system (first embodiment)
1003 Posted audio playback control system (third embodiment)
11, 101, 111
121 LAN line (network)
122 Public network (network)
125 Evaluation table 126 Primary evaluation table 127 Secondary evaluation table 128 User table 129 Posted audio data information table 130 Determination table 131 Grouping table 132 Priority evaluation table 133 User table 150
240 Browsing player terminal (user terminal)
300
Claims (6)
イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブルを格納する記憶部と、
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、
投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、
前記同時再生対象のグループに含まれる投稿音声データにおける、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理とを実行する演算部と、
を備えることを特徴とする投稿音声再生制御システム。 A communication unit that communicates with a user terminal used by a user of a social network service via a network;
A storage unit for storing a determination table in which identification information of an event and a selection keyword selected in advance for the event are associated;
Among the posted voice data received from the user terminal via the communication unit, the one to which the specified posting publication destination designation information is assigned is specified, and the voice recognition processing is performed on each of the specified posted voice data to obtain the text Processing to generate data and store the generated text data in the storage unit for each posting publication destination;
Collate each text data with a common posting publication destination against each selection keyword in the judgment table, specify the text data containing the same selection keyword as related to the same posting publication destination and the same event, Processing to store in the storage unit as
Search the start time or end time of the audio signal of the same selected keyword in the posted audio data included in the group to be simultaneously played, and search the unnecessary section from the start of the data to the start time, or the end of the data from the end The processing unit that deletes the audio signal of the unnecessary section up to and transmits the data that can be output by the audio output means to the user terminal when the posted audio data after the deletion is simultaneously reproduced When,
A posted voice reproduction control system comprising:
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、
投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、
前記同時再生対象のグループに含まれる、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理と、
を実行することを特徴とする投稿音声再生制御方法。 A communication unit that communicates via a network with a user terminal used by a user of a social network service, and a storage unit that stores a determination table in which event identification information and a selection keyword selected in advance for the event are associated with each other Computer
Among the posted voice data received from the user terminal via the communication unit, the one to which the specified posting publication destination designation information is assigned is specified, and the voice recognition processing is performed on each of the specified posted voice data to obtain the text Processing to generate data and store the generated text data in the storage unit for each posting publication destination;
Collate each text data with a common posting publication destination against each selection keyword in the judgment table, specify the text data containing the same selection keyword as related to the same posting publication destination and the same event, Processing to store in the storage unit as
The start time or end time of the audio signal of the same selected keyword included in the group to be simultaneously played is searched, and an unnecessary section from the beginning of the data to the start time, or an unnecessary section from the end time to the end of the data. Deleting the audio signal, and transmitting to the user terminal data that can be output by the audio output means when simultaneously reproducing each posted audio data after execution of the deletion,
A method for controlling the reproduction of posted audio, comprising:
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部に格納する処理と、
投稿公開先が共通な各テキストデータを前記判定テーブルの各選定キーワードに照合し、同一の選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し同時再生対象のグループとして記憶部に格納する処理と、
前記同時再生対象のグループに含まれる、前記同一の選定キーワードの音声信号の開始時点ないし終了時点を検索し、データ先頭から前記開始時点までの不要区間、ないし前記終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生した際の、音声出力手段で出力可能なデータを、前記ユーザ端末に送信する処理と、
を実行させることを特徴とする投稿音声再生制御プログラム。 A communication unit that communicates via a network with a user terminal used by a user of a social network service, and a storage unit that stores a determination table in which event identification information and a selection keyword selected in advance for the event are associated with each other Computer
Among the posted voice data received from the user terminal via the communication unit, the one to which the specified posting publication destination designation information is assigned is specified, and the voice recognition processing is performed on each of the specified posted voice data to obtain the text Processing to generate data and store the generated text data in the storage unit for each posting publication destination;
Collate each text data with a common posting publication destination against each selection keyword in the judgment table, specify the text data containing the same selection keyword as related to the same posting publication destination and the same event, Processing to store in the storage unit as
The start time or end time of the audio signal of the same selected keyword included in the group to be simultaneously played is searched, and an unnecessary section from the beginning of the data to the start time, or an unnecessary section from the end time to the end of the data. Deleting the audio signal, and transmitting to the user terminal data that can be output by the audio output means when simultaneously reproducing each posted audio data after execution of the deletion,
A post voice reproduction control program characterized by causing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012168740A JP5814879B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012168740A JP5814879B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014027615A JP2014027615A (en) | 2014-02-06 |
JP5814879B2 true JP5814879B2 (en) | 2015-11-17 |
Family
ID=50200844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012168740A Active JP5814879B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5814879B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10055767B2 (en) * | 2015-05-13 | 2018-08-21 | Google Llc | Speech recognition for keywords |
US11404041B2 (en) * | 2017-05-24 | 2022-08-02 | Nippon Hoso Kyokai | Audio guidance generation device, audio guidance generation method, and broadcasting system |
JP2019195149A (en) * | 2018-05-05 | 2019-11-07 | ナレルシステム株式会社 | Computer system, computer program, and method for group voice communication and past voice confirmation |
JP6455848B1 (en) * | 2018-09-27 | 2019-01-23 | Meetscom株式会社 | Information processing system |
-
2012
- 2012-07-30 JP JP2012168740A patent/JP5814879B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014027615A (en) | 2014-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4033944B2 (en) | Online karaoke system characterized by recommended music selection function according to music to be played | |
US20110126103A1 (en) | Method and system for a "karaoke collage" | |
Steffen | From Edison to Marconi: the first thirty years of recorded music | |
JP5814879B2 (en) | Posted audio playback control system, posted audio playback control method, posted audio playback control program | |
JP5779938B2 (en) | Playlist creation device, playlist creation method, and playlist creation program | |
JP2011095437A (en) | Karaoke scoring system | |
JP2014026603A (en) | Music selection support system, music selection support method, and music selection support program | |
JP5814878B2 (en) | Posted audio playback control system, posted audio playback control method, posted audio playback control program | |
JP5457791B2 (en) | Karaoke scoring system | |
Wright | Jaco Pastorius, the electric bass, and the struggle for jazz credibility | |
Pymm | Steve Reich’s Dramatic Sound Collage for the Harlem Six | |
KR100888341B1 (en) | System and Method for Searching a Sound Source, Server for Searching a Sound Source Therefor | |
Frisch | Reger’s historicist modernism | |
US20110077756A1 (en) | Method for identifying and playing back an audio recording | |
Armstrong | Hot collecting off the record: ralph J. Gleason’s start in music journalism | |
Boyd | " We're the Light Crust Doughboys from Burrus Mill" An Oral History | |
JP4331230B2 (en) | Online karaoke system, host device | |
Van Puymbroeck | Between Genre and Medium: Hilda Tablet, Henry Reed's Fictional Metabiography for Radio | |
Baade | Airing Authenticity: The BBC Jam Sessions from New York, 1938/39 | |
Lorre | Rhythm and Bluebeat: “Jamaican R&B,” Live and on Record, in Early-1960s’ London | |
Lott | “Turn Me Loose White Man” Or: Appropriating Culture: How to Listen to American Music, 1900-1960, by Allen Lowe | |
US20150073810A1 (en) | Music playing method and music playing system | |
Morgan et al. | “Britain Now Your Voices Join”: The Legacy of Peterloo in Song | |
Green | Cast Albums: Skip a Stage, Enjoy the Show. | |
JP2007121550A (en) | Karaoke contest system capable of reproducing and hearing singing voice of high order prizewinner, karaoke system, and contest server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141017 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5814879 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |