JP2014027614A - Contribution speech reproduction control system, contribution speech reproduction control method, and contribution speech reproduction control program - Google Patents
Contribution speech reproduction control system, contribution speech reproduction control method, and contribution speech reproduction control program Download PDFInfo
- Publication number
- JP2014027614A JP2014027614A JP2012168739A JP2012168739A JP2014027614A JP 2014027614 A JP2014027614 A JP 2014027614A JP 2012168739 A JP2012168739 A JP 2012168739A JP 2012168739 A JP2012168739 A JP 2012168739A JP 2014027614 A JP2014027614 A JP 2014027614A
- Authority
- JP
- Japan
- Prior art keywords
- posted
- data
- user
- audio data
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、投稿音声再生制御システム、投稿音声再生制御方法、投稿音声再生制御プログラムに関するものであり、具体的には、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とする技術に関する。 The present invention relates to a posted audio playback control system, a posted audio playback control method, and a posted audio playback control program. Specifically, a plurality of posted audio in a message service such as an audio SNS is continuously played back without feeling uncomfortable. TECHNICAL FIELD OF THE INVENTION
昨今、従来から存在するテキストベースのSNS(Social Network Service)に加え、音声メッセージの投稿、公開がなされる音声SNSが登場し、広がりを見せている。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。こうした音声SNSにおいては、投稿が音声であるが故の様々な新サービスの展開が想定される。例えば、音源らを関連づけて再生する既存技術として、ツリー型の音声掲示板システムにおいて、ある音声メッセージに複数のフォロー音声メッセージがついている場合に、音声メッセージを再生した後、いずれのフォロー音声メッセージを選択するかを決定するサーバ装置(特許文献1参照)などが提案されている。 In recent years, in addition to the existing text-based SNS (Social Network Service), voice SNSs for posting and publishing voice messages have appeared and are spreading. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved. In such a voice SNS, it is assumed that various new services will be developed because the posting is voice. For example, as an existing technology for playing back sound sources in association with each other, in a tree-type voice bulletin board system, if there are multiple follow voice messages attached to a voice message, select any follow voice message after playing the voice message A server device (see Patent Document 1) for determining whether to do so has been proposed.
上述した音声SNS等のメッセージサービスにおいて、つながりある他ユーザの投稿音声を聞くユーザが、単純に投稿順で各投稿音声を順次再生した場合、投稿音声間のテーマや雰囲気の相違により、投稿音声が示すメッセージをスムーズに理解できず、感情移入しにくいという問題点がある。特に、音声SNS上において他ユーザとのつながりが多いユーザであるほど、多種多様な投稿音声をシリアルに再生して、そうした問題点が大きくなり、ひいてはユーザビリティの低下が懸念される。 In a message service such as the above-mentioned voice SNS, when a user who listens to the posted voices of other connected users simply plays each posted voice sequentially in the order of posting, the posted voices may differ depending on the theme or atmosphere between the posted voices. There is a problem that the message shown cannot be understood smoothly and it is difficult to empathize. In particular, as the user has more connections with other users on the voice SNS, a variety of posted voices are serially reproduced, and such a problem becomes greater, and there is a concern that usability may be lowered.
そこで本発明の目的は、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とする技術を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a technique for continuously reproducing a plurality of posted voices in a message service such as a voice SNS without a sense of incongruity and enabling a good transmission of a poster's intention.
上記課題を解決する本発明の投稿音声再生制御システムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部と、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理とを実行する演算部と、を備えることを特徴とする。 The posted audio reproduction control system of the present invention that solves the above problems associates a communication unit that communicates with a user terminal used by a user of a social network service via a network, music data identification information, and a corresponding music theme. In addition, the storage unit for storing the grouping table in which the keyword of the posted audio data and the corresponding theme are associated with each other and the posted audio data received from the user terminal via the communication unit are assigned the same posting publication destination designation information. The identification information of the music to be played back simultaneously with the corresponding posted voice data, which is given to each identified posted voice data, is collated with the grouping table, and should be played back simultaneously with each posted voice data The music theme is specified, and posted audio data with the specified theme shared with each other A calculation unit that performs a process of storing the stored data as a group in a storage unit and a process of sequentially reproducing each posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. It is characterized by providing.
また、本発明の投稿音声再生制御方法は、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータが、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、を実行することを特徴とする。 Further, the posted audio reproduction control method of the present invention relates to a communication unit that communicates via a network with a user terminal used by a user of a social network service, the identification information of music data, and the theme of the corresponding music, and further posting A computer having a storage unit storing a grouping table in which a keyword of audio data is associated with a corresponding theme is given the same post release destination designation information among the posted audio data received from the user terminal via the communication unit The identification information of the music to be played back simultaneously with the corresponding posted audio data, which is given to each identified posted audio data, is collated with the grouping table and reproduced simultaneously with each posted audio data Specify the theme of the music to be played, and continuously play back the posted audio data that share the specified theme. And a process of storing each of the posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. To do.
また、本発明の投稿音声再生制御プログラムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータに、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、を実行させることを特徴とする。 The posted audio reproduction control program of the present invention associates a communication unit that communicates with a user terminal used by a user of a social network service via a network, music data identification information, and a corresponding music theme, and further posts Designated information of the same posting release destination is given to the computer having a storage unit that stores a grouping table in which a keyword of the audio data and the corresponding theme are associated with each other from the posted audio data received from the user terminal via the communication unit. The identification information of the music to be played back simultaneously with the corresponding posted audio data, which is given to each identified posted audio data, is collated with the grouping table and reproduced simultaneously with each posted audio data Identifies the theme of the music that should be performed, and continues the posted audio data that share the specified theme A process of storing in a storage unit as a raw target group, and a process of sequentially reproducing each posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. Features.
本発明によれば、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達が可能となる。 According to the present invention, a plurality of posted voices in a message service such as a voice SNS can be continuously reproduced without a sense of incongruity, and a good transmission of a poster's intention can be achieved.
−−−第1の実施形態におけるシステム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、第1の実施形態における投稿音声再生制御システム1003を含むネットワーク構成図である。図1に示す投稿音声再生制御システム1003(以下、システム1003)は、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the first embodiment ---
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a network configuration diagram including a posted audio
なお、音声SNSとは、従来から存在するテキストベースのSNSとは異なり、音声メッセージの投稿、公開がなされるSNSである。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。 Note that the voice SNS is an SNS in which a voice message is posted and released, unlike a conventional text-based SNS. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved.
図1に例示するシステム1003は、SNSサーバ150、公開Webサーバ160、および投稿記録装置170で構成されている。SNSサーバ150は、音声SNSに関する各種処理の主たる実行主体であり、音声SNSのユーザに関する認証情報や、各ユーザの投稿音声データの情報などを管理し、ユーザ認証や投稿音声の公開、再生といった処理を実行するサーバ装置となる。また、公開Webサーバ160は、インターネット網120を介してアクセスしてくるユーザ端末200と、上述のSNSサーバ150との間にあって、SNSサーバ150でのユーザ認証処理や、上述のSNSサーバ150が出力した、投稿音声データの再生データなど各種データの授受を仲介するサーバ装置である。また、投稿記録装置170は、ユーザ端末200から送られてくる投稿音声データを格納する情報処理装置であり、SNSサーバ150からの要求に応じて、当該要求が指定する投稿音声データを読み出してSNSサーバ150に送るものとなる。
A
なお、SNSサーバ150では、ソーシャルネットワークサービスの形態として当然ながら、ユーザ毎に、当該音声SNS上でのつながり(例:友人、知人、同僚、家族、一方的なフォロワー、趣味・嗜好等のグループなど)が規定された他ユーザの情報が管理されている。従って、ユーザが再生して聞くことが出来る投稿音声は、こうしたつながりを持った他ユーザのものとなる。そのため、投稿記録装置170では、ユーザ毎に、該当ユーザ宛て乃至該当グループ宛等に投稿された他ユーザの投稿音声データを紐付けて管理している。
Of course, in the
公開Webサーバ160およびSNSサーバ150は、ユーザ端末200(投稿者端末220、閲覧再生者端末240)からのアクセスに際し、所定のユーザ認証処理を経てアクセスユーザを特定し、該当ユーザに紐付けて投稿記録装置170にて管理している他ユーザからの投稿音声データの情報(例:投稿ユーザ名、投稿日時、タイトル、録音長等)を、該当ユーザ用のページ(SNSサイトにおける、いわゆるマイページ)にて、例えば投稿日時順に列挙するように設定し、このページデータを該当ユーザ端末200に送信することとなる。
The
公開Webサーバ160が、前記のユーザ用ページにて、所定投稿についての再生指示をユーザ端末200から受けた場合、公開Webサーバ160は該当投稿に関する再生指示の情報をSNSサーバ150に送る。SNSサーバ150ではこの再生指示の情報を受けて、該当投稿に関する投稿音声データを投稿記録装置170から読み出して再生し、その再生データを公開Webサーバ160を介してユーザ端末200に送信する。ユーザ端末200では、この再生データをインターネット網120を介して受信し、スピーカーで出力する。
When the
一方、音声SNSのユーザが利用する端末がユーザ端末200である。このユーザ端末200は、例えば図1にて示すように、投稿者端末220、230、閲覧再生者端末240に分類できる。投稿者端末220は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示すると共に、自ユーザによる投稿音声の入力をマイクで受け付けて、対応する投稿音声データを公開Webサーバ160にアップロードする端末となる。また、閲覧再生者端末240は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示する端末となる。
On the other hand, the terminal used by the user of the voice SNS is the
なお、投稿者端末220、閲覧再生者端末240が公開Webサーバ160にアクセスする場合、当然ながら、音声SNSにおける自分用のページにログインするためのユーザ認証処理が必要となる。従って、投稿者端末220、閲覧再生者端末240では、利用中のユーザによる認証情報の入力を受け付けて、これを認証依頼と共に、公開Webサーバ160を介してSNSサーバ150に送信する。この場合、SNSサーバ150は、前記の認証情報を、認証用の情報を格納したデータベース等に照合してユーザ認証を実行し、その認証結果に応じて、該当投稿者端末220や閲覧再生者端末240からの公開Webサーバ160における該当ユーザ用ページへのアクセス可否を制御する。また、SNSサーバ150は、前記の認証結果を公開Webサーバ160を介して投稿者端末220や閲覧再生者端末240に送信する。
In addition, when the
また、上述したように、投稿音声データやその再生データの授受等をインターネット網120を介して行う場合の他に、ユーザ端末200の電話機能と、公衆回線網122らを用いて投稿音声データやその再生データの授受等を行う形態も想定できる。この場合、図1にて示すように、上述のSNSサーバ150や投稿記録装置170にLAN回線121を介して接続する電話応答システム300がネットワーク構成に含まれる。
Further, as described above, in addition to the case where the posting voice data and its reproduction data are exchanged via the
この電話応答システム300は、交換機310、自動音声応答装置320、CTI(Computer Telephony Integration)装置330から構成されている。そのうち交換機310は、電話回線を相互接続し電話網を構成するための交換機であり、自動音声応答装置320は、電話の応答と音声による情報の入出力や対話をコンピュータにて行う装置であり、CTI装置330は、電話やFAXをコンピュータシステムに統合する装置である。
The
こうした構成において、ユーザ端末たる投稿者端末230より、予め定められた投稿受付電話番号へ発話がなされた場合、上述の投稿者端末230は、公衆回線網122を経て交換機310へ接続され、この接続に応じて、CTI装置330での発話番号取得や自動応答装置320での自動音声ガイダンス再生がなされる。その後、上述の投稿者端末230において、投稿者がメッセージを発話した場合、その発話メッセージは自動音声応答装置320を経て、投稿音声データとして投稿記録装置170に録音、すなわち登録される。また、この投稿音声データの登録処理にあわせ、自動音声応答装置320が、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を、SNSサーバ150に通知する。SNSサーバ150では、この通知を受けて、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を記憶部に格納することとなる。
In such a configuration, when an utterance is made from a
続いて、システム1003のハードウェア構成について説明する。第1の実施形態におけるシステム1003は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。まずは、システム1003における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1003を構成するSNSサーバ150は、図2に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第1の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、グルーピングテーブル131、優先度評価テーブル132、およびユーザテーブル133が少なくとも記憶されている。これらテーブルの詳細については後述する。
In this case, as illustrated in FIG. 2, the
また、公開Webサーバ160も同様に、図3に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部111、RAMなど揮発性記憶装置で構成されるメモリ113、前記記憶部111に保持されるプログラム112をメモリ113に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部114、インターネット網120、LAN回線121と接続し他装置との通信処理を担う通信部115、を備える。なお、記憶部111内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム112、および、音声SNSサイトの各種Webページデータ116が少なくとも記憶されている。
Similarly, as illustrated in FIG. 3, the
また、投稿記録装置170も同様に、図4に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部11、RAMなど揮発性記憶装置で構成されるメモリ13、前記記憶部11に保持されるプログラム12をメモリ13に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部14、LAN121と接続し他装置との通信処理を担う通信部15、を備える。なお、記憶部11内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム12、および、各ユーザ端末200(投稿者端末220、230)から受信した投稿音声データ16が少なくとも記憶されている。投稿音声データ16には、各投稿音声データのファイル(ファイル名が識別情報ともなる)と、該当投稿音声の投稿者、投稿日時、公開先、および該当投稿音声データと共に再生するBGMの識別情報といったデータが対応付けて格納されている(図4)。
Similarly, as illustrated in FIG. 4, the posting
続いて、第1の実施形態のシステム1003が備える機能について説明する。第1の実施形態におけるシステム1003は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1003として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1003において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Next, functions provided in the
この場合、システム1003は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データのうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定し、該当投稿音声データに同時再生すべき音楽が付与されている場合は、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を、一方、該当投稿音声データに同時再生すべき音楽が付与されていない場合は、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部101に格納する機能を有している。
In this case, the
また、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を有している。
In addition, the
なお、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出し、このユーザの属性情報を優先度評価テーブル132に照合して、ユーザの属性情報に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。
Note that the
また、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データ16を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを優先度評価テーブル132に照合して、ユーザの投稿内容に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。
In addition, the
なお、システム1003は、上述の投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを記憶部101にて設定する機能を備えるとしてもよい。この場合、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生する際、上述のフラグが設定されているテーマに対応した連続再生対象のグループについては再生をせず、他の連続再生対象のグループの再生を優先する。
In addition, when the
−−−第1の実施形態におけるデータ構造例−−−
次に、第1の実施形態のシステム1003が用いるテーブルにおけるデータ構造例について説明する。図5は、第1の実施形態のグルーピングテーブル131の一例を示す図である。このグルーピングテーブル131は、「バースデイソング」、「ウェディングソング」といったBGM名、すなわち音楽データの識別情報をキーとして、投稿音声を音声認識により生成したテキストキーワード、「お祝い系」、「元気系」といった該当音楽または投稿音声のテーマ、および「楽しい」、「明るい」といったトーン(曲調)とを対応付けたレコードの集合体となっている。
--- Example of data structure in the first embodiment ---
Next, an example of a data structure in a table used by the
図6は第1の実施形態の優先度評価テーブル132の一例を示す図である。また、優先度評価テーブル132は、ユーザの属性情報(例:誕生日等)ないし投稿内容(例:結婚、試合等)と、連続再生対象の再生優先レベルとを対応付けたレコードの集合体となっている。図6における優先度評価テーブル132の例では、連続再生対象のグループの公開先であるユーザの属性情報(例:誕生日等)ないし直近の投稿内容(例:結婚、試合等)が、当該優先度評価テーブル132におけるユーザ属性ないし投稿内容の項目値にマッチした場合、該当連続再生対象のグループに付与される所定の評価得点の値が規定されたテーブルとなっている。 FIG. 6 is a diagram illustrating an example of the priority evaluation table 132 according to the first embodiment. In addition, the priority evaluation table 132 includes a collection of records in which user attribute information (eg, birthday, etc.) or post content (eg, marriage, match, etc.) is associated with a playback priority level to be continuously played back. It has become. In the example of the priority evaluation table 132 in FIG. 6, the attribute information (eg, birthday) of the user who is the disclosure destination of the group to be continuously reproduced or the latest posted content (eg, marriage, match, etc.) This table defines a predetermined evaluation score value to be given to the group to be subjected to continuous reproduction when the user attribute or the post content item value in the degree evaluation table 132 is matched.
図7は第1の実施形態のユーザテーブル133の一例を示す図である。また、ユーザテーブル133は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。 FIG. 7 is a diagram illustrating an example of the user table 133 according to the first embodiment. Further, the user table 133 is a table describing attribute information of each user of the voice SNS. In the example of the figure, user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user using the user ID as a key. It is a collection of records that correspond to each other.
−−−第1の実施形態における処理手順例−−−
以下、第1の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1003を構成する各装置らがメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the first embodiment ---
Hereinafter, the actual procedure of the posted audio reproduction control method in the first embodiment will be described with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read out from a memory or the like and executed by each device constituting the
図8は、第1の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データ16のうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定する(s100)。
FIG. 8 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the first embodiment. Here, the
また、SNSサーバ150は、上述のステップs100で特定された当該投稿音声データに同時再生すべき音楽が付与されているか否かを判定し(s101)、付与されている場合、特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報をグルーピングテーブル131に照合して、各投稿音声データと同時再生すべき音楽のテーマ(例:誕生日祝い、結婚祝い等)やトーンを特定する(s102)。この場合、SNSサーバ150は、投稿記録装置170にて該当投稿音声データ16に関して付与されている、「バースデイソング」といったBGMの識別情報を読み取り、当該BGMの識別情報をグルーピングテーブル131に照合して、該当投稿音声データと同時再生すべき音楽のテーマを「お祝い系」、トーンを「楽しい・明るい」などと特定することになる。なお、各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報は、後述する第2の実施形態における音楽選択支援システム1001により特定され、投稿記録装置170にて投稿音声データに付与されたものであると想定する。
In addition, the
また、上述のステップs100で特定された当該投稿音声データに同時再生すべき音楽が付与されていない場合、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定する(s103)。 If the music to be played back simultaneously is not given to the posted audio data specified in step s100 described above, a speech recognition process is performed on each specified posted audio data to generate text data, The generated text data is collated with the grouping table 131, and the theme (for example, birthday celebration, wedding celebration, etc.) of each posted audio data is specified (s103).
続いてSNSサーバ150は、上述のステップs102またはs103で特定したテーマ、好ましくは更にトーンも互いに共通する投稿音声データらを、連続再生対象のグループとして記憶部101に格納する(s104)。SNSサーバ150における、この投稿音声データのグルーピングの処理は、上述のステップs100で特定した全ての投稿音声データに関して処理完了するまで繰り返し実行することとなる(s105)。図9に示す評価結果例では、同一公開先の投稿音声データとして、「投稿1」〜「投稿7」までの7つの投稿が特定され、それら各投稿に紐付けされていたBGMの識別情報が「BGM1:バースデイソング」、「BGM2:応援歌」、「BGM3:卒業ソング」、「BGM4:バースデイソング」、「BGM5:卒業ソング」、「BGM6:バレンタインソング」、「BGM7:BGMなし」であり、それらのテーマに基づくグループは、「投稿1:お祝い系」、「投稿2:元気系」、「投稿3:お別れ系」、「投稿4:お祝い系」、「投稿5:お別れ系」、「投稿6:お祝い系」、「投稿7:お祝い系」と分類された。
Subsequently, the
次に、SNSサーバ150は、上述の連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出す(s106)。また、SNSサーバ150は、前記グループにおける投稿公開先のユーザに関する直近の投稿音声データ16(直近から一定期間遡った複数件であってもよい)を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s107)。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。
Next, the
SNSサーバ150は、上述のステップs106,s107で得た、前記ユーザの属性情報およびテキストデータ(すなわち直近の投稿内容)を、優先度評価テーブル132に照合し、これらユーザの属性情報および直近の投稿内容に応じて、該当グループの再生優先レベルを特定する(s108)。
The
図9に示す評価結果例の場合、投稿公開先のユーザの属性情報が、「誕生日:2月」であり、また、当該ユーザによる直近の投稿内容が「明日はサッカーの試合のあと、誕生日パーティだ!」、「週末はバレンタイン」、「来月で卒業。さみしいなあ」であった。そのため、「投稿1」〜「投稿7」の各投稿のうち、「投稿1」については、その投稿内容が「7歳の誕生日おめでとう」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿2」については、その投稿内容が「明日の試合がんばろう」であるから、"試合"なるキーワードについて「10点」獲得し、該当グループの「元気系」にこの10点を加算する。また、「投稿3」については、その投稿内容が「もうすぐ卒業式、高校は別々で寂しいね」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿4」については、その投稿内容が「ハッピーバースディ。もう7才。大きくなったね」であるから、"バースデイ"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿5」については、その投稿内容が「卒業してもまたみんなで遊ぼう」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿6」については、その投稿内容が「バレンタインチョコ作りで忙しいよう」であるから、"バレンタイン"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿7」については、その投稿内容が「今日の誕生日会はみんなにお祝いしてもらって楽しかった」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。
In the case of the evaluation result example shown in FIG. 9, the attribute information of the posting release destination user is “birthday: February”, and the latest posted content by the user is “birth tomorrow after a soccer game, "It was a party!", "Valentine on the weekend", "Graduated next month. Therefore, among the posts from “
各グループの得点は、「投稿1」、「投稿4」、「投稿6」、「投稿7」から10点づつ得たお祝い系が合計40点となり、「投稿2」からのみ10点得た元気計が合計10点となり、「投稿3」、「投稿5」から10点づつ得たお別れ系が合計20点となった。従って、SNSサーバ150は、こうして得た各グループの総得点が高いものほど、再生優先レベルが高いと判定し、これに応じてグループ間の再生順序を、再生順序1位:お祝い系、再生順序2位:お別れ系、再生順序3位:元気系、と決定する(s109)。
The score of each group is 40 points in total for 10 points from “
続いてSNSサーバ150は、上述のステップs109で決定した再生順序で、該当連続再生対象のグループを、投稿記録装置170(ないし投稿記録装置170から投稿音声データをコピーした記憶部101)より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する(s110)。
Subsequently, the
なお、SNSサーバ150は、上述のステップs110における投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合(s111:Yes)、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを、記憶部101にて設定するとしてもよい(s112)。このステップs112の処理後のSNSサーバ150は、後に、ステップs110を再度実行するに際し、上述のフラグが設定されているテーマに対応した連続再生対象のグループについて、該当フラグの示す有効期間内の間は、再生をせず、他の連続再生対象のグループのうち再生順序が早いものから再生を優先する。このような処理を行うこととすれば、システム1003側で決定した再生順序を、ユーザが好ましく思わなかった事実を確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。
Note that the
また、SNSサーバ150は、上述のフラグの起源である再生停止指示を行ったユーザ毎に、前記フラグの設定履歴を該当グループと対応付けて記憶部101にて保持しておくとしてもよい。この場合、SNSサーバ150は、該当ユーザに関して、各グループでのフラグ設定頻度を一定期間毎に算定し、グループ間でフラグ設定頻度が最高となったものについて、以後再びフラグが設定される際には、フラグの有効期間すなわち再生対象排除の期間を通常より一定期間延長するといった処理を実行する。このような処理を行うこととすれば、ユーザが好ましく思わなかった事実を更に確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。
The
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
こうした第1の実施形態によれば、音声SNSにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達が可能となる。 According to the first embodiment, it is possible to continuously reproduce a plurality of posted voices in the voice SNS without a sense of incongruity, and to appropriately transmit the poster intention.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第1の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの属性情報と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記優先度評価テーブルに照合して、前記ユーザの属性情報に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。 At least the following will be clarified by the description of the present specification. That is, in the posted audio reproduction control system according to the first embodiment, the storage unit includes a user table describing attribute information of each user of the social network service, user attribute information, and a reproduction priority level for continuous reproduction. An associated priority evaluation table, wherein the calculation unit reads attribute information related to a posting release destination user in the group to be continuously reproduced from the user table, and the attribute information of the user is read from the priority evaluation table. The playback priority level of the group according to the attribute information of the user is determined, the playback order between the groups is determined according to the level of the playback priority level, and the continuous playback target in the playback order is determined. Read the group from the storage unit, play each post audio data included in the group sequentially, Data is the one that transmits to the user terminal may be.
また、第1の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、各ユーザ端末から受信した投稿音声データを蓄積しているものであり、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの投稿内容と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記優先度評価テーブルに照合して、前記ユーザの投稿内容に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。 In the posted audio playback control system according to the first embodiment, the storage unit stores posted audio data received from each user terminal, and describes attribute information of each user of the social network service. A user table, and a priority evaluation table that associates the user's posted content with the playback priority level of the continuous playback target, and the calculation unit includes the latest user related post posting destination in the group of the continuous playback target Read the posted voice data from the storage unit, execute voice recognition processing on the corresponding posted voice data to generate text data, check the text data against the priority evaluation table, and according to the user's posted content The playback priority level of the group is specified, and the playback order between groups is determined according to the level of the playback priority level. The continuous playback target group is read from the storage unit in the playback order, each posted audio data included in the group is sequentially played back, and the played back data is transmitted to the user terminal. Good.
−−−第2の実施形態におけるシステム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。第2の実施形態の音楽選択支援システム1001を含むネットワーク構成は、第1の実施形態におけるネットワーク構成(図1)と同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第2の実施形態における音楽選択支援システム1001(以下、システム1001)は、音声SNS(Social Network Service)での投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図るコンピュータシステムである。
--- System configuration in the second embodiment ---
Embodiments of the present invention will be described below in detail with reference to the drawings. The network configuration including the music
続いてシステム1001のハードウェア構成について説明する。第2の実施形態におけるシステム1001は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。ここでは、システム1001における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1001を構成するSNSサーバ150は、図10に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第2の実施形態の音楽選択支援システムとして必要な機能を実装する為のプログラム102、評価テーブル125、ユーザテーブル128、および、投稿音声データ情報テーブル129が少なくとも記憶されている。なお、評価テーブル125は、一次評価テーブル126と二次評価テーブル127から構成されている。
In this case, as illustrated in FIG. 10, the
続いて、第2の実施形態のシステム1001が備える機能について説明する。第2の実施形態におけるシステム1001は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1001として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1001において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Next, functions provided in the
この場合、システム1001は、ユーザ端末200から受信した投稿音声データ(投稿記録装置170で格納されているもの)に対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する機能を有している。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。
In this case, the
また、システム1001は、上述の音声認識処理で生成したテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有している。ここで、システム1001は、マッチ度が最も高い選定キーワード群を特定するとしてもよい。他方、ユーザ端末200では、この推奨情報を受信してディスプレイにて表示し、ユーザに閲覧させる。
Further, the
ユーザが上述の推奨情報の示す音楽を容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。SNSサーバ150は、容認通知を受信した音楽のデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信することとなる。或いは、上述の如き、システム1001は、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
When the user accepts the music indicated by the recommended information, the
また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、すなわち、マッチ度最高のものが並存していた場合、ユーザ端末200のユーザに関する属性情報をユーザテーブル128より読み出し、ユーザの属性情報を評価テーブル125の各ユーザ属性に照合して、ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。当然この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
Further, the
また、システム1001は、マッチ度が最も高い選定キーワード群を複数特定した場合に、該当投稿音声データに、ソーシャルネットワークサービスにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する機能を有しているとしてもよい。
Further, the
この場合、システム1001は、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合、該当指定情報が示す投稿公開先のユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿公開先のユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In this case, when the
一方、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合、システム1001は、該当投稿音声データの投稿ユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する処理を実行するものとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
On the other hand, as a result of the determination, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data, the
また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近の投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、該当投稿音声データに対し、上述同様の音声認識処理を実行してテキストデータを生成し、当該テキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In addition, when the
また、システム1001は、上述のテキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近から所定範囲の期間の各投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出し、当該キーワードを評価テーブル125の各選定キーワード群に照合して、出現頻度一定以上のキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。
In addition, when the
−−−第2の実施形態におけるデータ構造例−−−
次に、第2の実施形態のシステム1001が用いるテーブルにおけるデータ構造例について説明する。図11は第2の実施形態の評価テーブル125の一例を示す図である。評価テーブル125は、音楽データの識別情報と該当音楽データに関して予め選定された選定キーワード群とを対応付けたテーブルであり、第2の実施形態では、一次評価テーブル126と二次評価テーブル127とで構成している。図に示す例では、一次評価テーブル126は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定された、「たんじょうび」、「ばーすでい」、「はっぴー」、などといった選定キーワード群とを対応付けたレコードの集合体となっている。また、二次評価テーブル127は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定されたユーザ属性(例:誕生日当日、ロック音楽好き、40代)、および直近書込みが含むキーワード(例:結婚、クリスマス等)を対応付けたレコードの集合体となっている。
--- Example of data structure in the second embodiment ---
Next, an example of a data structure in a table used by the
図12は第2の実施形態のユーザテーブル128の一例を示す図である。ユーザテーブル128は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。 FIG. 12 is a diagram illustrating an example of the user table 128 according to the second embodiment. The user table 128 is a table in which attribute information of each user of the voice SNS is described. In the example of the figure, the user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user are associated with the user ID as a key. It is a collection of attached records.
図13は第2の実施形態の投稿音声データ情報テーブル129の一例を示す図である。投稿音声データ情報テーブル129は、投稿記録装置170に格納されている投稿音声データに関する情報を、該当投稿音声データの公開先毎に格納したテーブルであり、図の例では、「U00001」といったユーザID毎に、投稿音声データIDをキーとして、該当投稿音声データの投稿者、投稿日時、投稿音声データのタイトル(識別情報)といった値を対応付けたレコードの集合体となっている。
FIG. 13 is a diagram illustrating an example of the posted audio data information table 129 according to the second embodiment. The posted audio data information table 129 is a table in which information related to posted audio data stored in the posting
−−−第2の実施形態における処理手順例−−−
以下、第2の実施形態における音楽選択支援方法の実際手順について図に基づき説明する。以下で説明する音楽選択支援方法に対応する各種動作は、システム1001を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the second embodiment ---
Hereinafter, the actual procedure of the music selection support method in the second embodiment will be described with reference to the drawings. Various operations corresponding to the music selection support method described below are realized by programs that are read into the memory and executed by the devices constituting the
図14は、第2の実施形態における音楽選択支援方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信して投稿記録装置170に格納された投稿音声データを、投稿記録装置170より取得する(s200)。
FIG. 14 is a flowchart showing a processing procedure example of the music selection support method according to the second embodiment. Here, the
次に、SNSサーバ150は、上述で取得した投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s201)。ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、一次評価テーブル126における、各BGMの選定キーワード群に照合して、テキストデータが含むキーワードと各BGMとのマッチ度を算定する(s202)。
Next, the
このように、テキストデータが含むキーワードと各BGMとのマッチ度を算定する処理は、例えば次のような処理手順となる。テキストデータが含むキーワードが、「けっこん」、「おめでとう」、「しあわせ」であった場合、SNSサーバ150は、これらキーワードを一次評価テーブル126に照合し、「けっこん」のキーワードについては、適合時得点の「10点」を特定し、「おめでとう」のキーワードについては、適合時得点の「6点」を特定し、「しあわせ」のキーワードについては、適合時得点の「6点」を特定する。こうした、「けっこん」、「おめでとう」、「しあわせ」の各キーワードに関する適合時得点の特定処理を、一次評価テーブル126における各BGMのレコードについて実行し(s203)、図15に示す評価結果例1のように、各BGM毎の得点計を算定する。図15の例では、"BGM2:ウェディングソング"について最高得点「19点」が算定された。
As described above, the process for calculating the degree of matching between the keyword included in the text data and each BGM is, for example, the following processing procedure. When the keywords included in the text data are “Kekkon”, “Congratulations”, and “Happiness”, the
このように、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが1つのみ特定された場合(s204:No)、SNSサーバ150は、特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者のユーザ端末200に送信する(s205)。該当投稿音声データの投稿者情報は勿論のこと、公開先は、投稿音声データの投稿時に投稿者が指定しており、公開先となったユーザないしグループの情報が該当投稿音声データに付帯して投稿記録装置170や投稿音声データ情報テーブル129に格納されているものとする。
As described above, only the keyword with the highest degree of matching with the keyword included in the text data, that is, the keyword group with the highest score = BGM is specified by the matching of the keyword of the text data to the primary evaluation table 126 and the score calculation process. In the case (No at s204), the
なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。
Note that the
SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。なお、SNSサーバ150は、上述の如き、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応するBGMのデータを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信するとしてもよい。
The
一方、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが複数特定された場合(s204:Yes)、SNSサーバ150は、該当投稿音声データに、音声SNSにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する(s206)。
On the other hand, when the matching of the keywords of the text data to the primary evaluation table 126 and the score calculation process specify a plurality of keywords having the highest degree of matching with the keywords included in the text data, that is, the highest score keyword group = BGM (s204). : Yes), the
この場合、SNSサーバ150は、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合(s206:Yes)、該当指定情報が示す「投稿公開先」のユーザに関して、ユーザテーブル128から属性情報を読み出す(s207)。このステップs207において、SNSサーバ150は、更に、「投稿公開先」のユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。
In this case, if the
他方、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合(s206:No)、SNSサーバ150は、該当投稿音声データの「投稿」ユーザに関して、ユーザテーブル128から属性情報を読み出す(s208)。このステップs208において、SNSサーバ150は、更に、「投稿」ユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。
On the other hand, as a result of the determination in the above-described step s206, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data (s206: No), the
続いてSNSサーバ150は、上述のステップs207、s208のいずれかで得た、ユーザの属性情報および直近書込みから得たキーワードを、二次評価テーブル127に照合し、各BGMに関して規定されているユーザの属性情報およびキーワードとのマッチ度を算定する(s209)。
Subsequently, the
このように、ユーザの属性情報およびキーワードと、各BGMとのマッチを算定する処理は、例えば次のような処理手順となる。ユーザの属性情報が「年齢:40」、「音楽志向:ロック」であり、キーワードが、「フットサル」、「がんばろう」であった場合、SNSサーバ150は、これらの値を二次評価テーブル127に照合し、「年齢:40」、「音楽志向:ロック」の各値については適合時得点の「10点」をそれぞれ特定し、「フットサル」、「がんばろう」の各キーワードについては、適合時得点無しを特定する。こうした、ユーザの属性情報およびキーワードに関する適合時得点の特定処理を、二次評価テーブル127における各BGMのレコードについて実行し(s210)、図16に示す評価結果例2のように、各BGM毎の得点計を算定する。
As described above, the process for calculating the match between the user attribute information and the keyword and each BGM is, for example, the following processing procedure. When the attribute information of the user is “age: 40”, “music-oriented: rock”, and the keywords are “futsal” and “good luck”, the
図16の例では、一次評価テーブル126を用いた評価で最高得点となった"BGM4"、"BGM5"、"BGM6"、のうち、二次評価テーブル127を用いた評価で、"BGM6"に計20点が算定された。このように、二次評価テーブル127へのユーザの属性情報およびキーワードの照合と得点算定の処理により、ユーザの属性情報およびキーワードとのマッチ度最高のもの、つまり最高得点のBGMを特定する。 In the example of FIG. 16, among the “BGM4”, “BGM5”, and “BGM6” that have the highest score in the evaluation using the primary evaluation table 126, the evaluation using the secondary evaluation table 127 is changed to “BGM6”. A total of 20 points were calculated. In this way, by matching the user attribute information and keywords to the secondary evaluation table 127 and processing for score calculation, the BGM having the highest degree of match with the user attribute information and keywords, that is, the highest score BGM is specified.
続いてSNSサーバ150は、上述のステップs205と同様に、上述のステップs209で特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者のユーザ端末200に送信する(s211)。なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。
Subsequently, as in step s205 described above, the
SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。
The
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.
こうした第2の実施形態によれば、音声SNSでの投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図ることが可能となる。 According to such 2nd Embodiment, it becomes possible to select music efficiently with respect to the contribution sound | voice by audio | voice SNS, and, by extension, the usability improvement by audio | voice SNS can be aimed at.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、上述の第2の実施形態の音楽選択支援システムにおいて、前記記憶部は、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルを備え、前記評価テーブルにおいて、音楽データの識別情報に対し、該当音楽データに関して予め選定されたユーザ属性を更に対応付けて格納するものであり、前記演算部は、前記テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記評価テーブルの各ユーザ属性に照合して、前記ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を更に実行するものである、としてもよい。 At least the following will be clarified by the description of the present specification. That is, in the music selection support system of the second embodiment described above, the storage unit includes a user table in which attribute information of each user of the social network service is described. The user attribute selected in advance with respect to the corresponding music data is further stored in association with each other, and the calculation unit collates the text data with each selected keyword group of the evaluation table, and includes the keyword included in the text data. When a plurality of selected keyword groups having a matching degree equal to or greater than a predetermined value are specified, attribute information about the user of the user terminal is read from the user table, and the attribute information of the user is collated with each user attribute of the evaluation table. The user attribute having the highest degree of matching with the user attribute information. Constant, and the identification information of the music data corresponding to the user attribute identified, said as post recommendation information of the music to be reproduced together with the audio data is to further execute a process of transmitting to the user terminal may be.
また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記マッチ度が最も高い選定キーワード群を複数特定した場合に、該当投稿音声データに、ソーシャルネットワークサービスにおける公開先の指定情報が付与されているか判定する処理と、前記判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合、該当指定情報が示す投稿公開先のユーザに関して、ユーザテーブルから属性情報を読み出し、当該属性情報を前記評価テーブルの各ユーザ属性に照合して、前記投稿公開先のユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理と、前記判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合、該当投稿音声データの投稿ユーザに関して、ユーザテーブルから属性情報を読み出し、当該属性情報を前記評価テーブルの各ユーザ属性に照合して、前記投稿ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を実行するものである、としてもよい。 In the music selection support system according to the second embodiment described above, when the calculation unit specifies a plurality of selected keyword groups having the highest degree of match, the calculation unit may include the posting destination of the social network service in the corresponding posted voice data. When it is determined that the designation information of the posting publishing destination is given to the corresponding posted audio data as a result of the determination of whether the designation information is given and the result of the judgment, regarding the user of the posting publishing destination indicated by the corresponding designation information, Attribute information is read from the user table, the attribute information is compared with each user attribute of the evaluation table, the user attribute having the highest degree of matching with the attribute information of the user of the posting disclosure destination is specified, and the specified user attribute The user terminal as the recommended information of music to be reproduced together with the posted audio data, with the identification information of the music data corresponding to When it is determined that the post publishing destination designation information is not given to the corresponding posted audio data as a result of the transmission and the determination, the attribute information is read from the user table for the posting user of the corresponding posted audio data, and the attribute Information is collated with each user attribute of the evaluation table, the user attribute having the highest degree of matching with the attribute information of the posting user is specified, and the identification information of the music data corresponding to the specified user attribute is A process of transmitting music to the user terminal as recommended information for music to be played back together with the data may be executed.
また、上述の第2の実施形態の音楽選択支援システムにおいて、前記記憶部は、各ユーザ端末から受信した投稿音声データを蓄積しているものであり、前記演算部は、前記テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を実行するものである、としてもよい。 In the music selection support system according to the second embodiment described above, the storage unit stores post voice data received from each user terminal, and the calculation unit evaluates the text data as the evaluation. When the selected keyword group having the highest degree of matching with the keyword included in the text data is identified in comparison with each selected keyword group in the table, the latest posted voice data related to the user of the user terminal is read from the storage unit, For the corresponding posted voice data, voice recognition processing is executed to generate text data, and the text data is collated with each selected keyword group in the evaluation table, and the degree of matching with the keyword included in the text data is the highest. The selected keyword group is specified, and the music data identification information corresponding to the specified selected keyword group is And it executes a process of transmitting to the user terminal as the recommended information of the music to be reproduced together with draft speech data may be.
また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する直近から所定範囲の期間の各投稿音声データを記憶部より読み出し、各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出し、当該キーワードを前記評価テーブルの各選定キーワード群に照合して、前記出現頻度一定以上のキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信するものである、としてもよい。 In the music selection support system according to the second embodiment described above, when the calculation unit specifies a plurality of selected keyword groups having the highest degree of matching with the keyword included in the text data, the calculation unit most recently relates to the user of the user terminal. From the storage unit, each posted voice data for a predetermined period is read from the storage unit, and voice recognition processing is performed on each posted voice data to generate text data, and keywords with a certain appearance frequency are extracted across each text data. The keyword is compared with each selected keyword group in the evaluation table, the selected keyword group having the highest degree of matching with the keyword having a certain appearance frequency or more is identified, and the music data corresponding to the identified selected keyword group The identification information is transmitted to the user terminal as recommended information for music to be played along with the posted audio data. It is shall, may be.
また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記特定した選定キーワード群に対応する音楽データを、前記投稿音声データと合わせて再生し、当該再生したデータを前記ユーザ端末に送信する処理を実行するものであるとしてもよい。 In the music selection support system of the second embodiment described above, the calculation unit reproduces music data corresponding to the specified selected keyword group together with the posted voice data, and the reproduced data is It is good also as what performs the process transmitted to a user terminal.
−−−第3の実施形態におけるシステム構成−−−
以下に本発明の第3の実施形態について図面を用いて詳細に説明する。第3の実施形態の投稿音声再生制御システム1002を含むネットワーク構成は第1および第2の実施形態のネットワーク構成(図1)ものと同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第3の実施形態における投稿音声再生制御システム1002(以下、システム1002)は、音声SNSにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the third embodiment ---
Hereinafter, a third embodiment of the present invention will be described in detail with reference to the drawings. The network configuration including the posted audio
続いてシステム1002のハードウェア構成について説明する。第3の実施形態におけるシステム1002は、第1の実施形態と同様、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。まずは、システム1002における処理の実行主体たるSNSサーバ150について説明を行うこととする。
Next, the hardware configuration of the
この場合、システム1002を構成するSNSサーバ150は、図17に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第3の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブル130が少なくとも記憶されている。
In this case, as illustrated in FIG. 17, the
続いて、第3の実施形態のシステム1002が備える機能について説明する。第3の実施形態におけるシステム1002は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1002として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1002において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。
Subsequently, functions provided in the
この場合、システム1002は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する機能を有している。
In this case, the
また、システム1002は、上述で得た投稿公開先が共通な各テキストデータを判定テーブル130の各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、同時再生対象のグループとして記憶部に格納する機能を有している。
Further, the
また、システム1002は、上述の同時再生対象のグループに含まれる投稿音声データにおける、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索し、データ先頭から開始時点までの不要区間、ないし終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信する機能を有している。
Further, the
また、システム1002は、上述の削除実行後の各投稿音声データを、データ先頭から同時に再生したデータをユーザ端末200に送信するとしてもよい。或いは、システム1002は、削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータをユーザ端末200に送信するとしてもよい。
In addition, the
また、システム1002は、上述の削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速で再生し、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速で再生して、各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信するとしてもよい。
Further, the
−−−第3の実施形態におけるデータ構造例−−−
次に、第3の実施形態のシステム1002が用いるテーブルにおけるデータ構造例について説明する。図18は、第3の実施形態における判定テーブル130の一例を示す図である。判定テーブル130は、「結婚」、「誕生日」、「合格」といった各種イベントの識別情報をキーに、該当イベントに関して予め選定された、「けっこんおめでとう」、「たんじょうびおめでとう」、「ハッピーウェデング」といった選定キーワードを対応付けたレコードの集合体となっている。
--- Example of data structure in the third embodiment ---
Next, an example of a data structure in a table used by the
−−−第3の実施形態における処理手順例−−−
以下、第3の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1002を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the third embodiment ---
The actual procedure of the posted audio reproduction control method in the third embodiment will be described below with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read into the memory and executed by each device constituting the
図19は、第3の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定する(s300)。
FIG. 19 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the third embodiment. Here, the
次に、SNSサーバ150は、上述で特定した投稿音声データそれぞれに対し、プログラム102が含む音声認識プログラムを呼び出して実行して音声認識処理を実行し(s301)、テキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する(s302)。
Next, the
ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、判定テーブル130における各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、合成再生対象グループとして記憶部101に記憶する(s303)。SNSサーバ150は、このステップs303の処理を、上述のステップs302で得ている各投稿音声データについて全て実行する(s304)。こうした処理により、例えば、あるユーザ「U00001」を公開先とし、「けっこんおめでとう」という選定キーワードを共通に含んでいた投稿音声データが特定されたとする。図18に示す判定テーブル130の例であれば、この場合の投稿音声データのテーマは、イベント「結婚祝い」となる。また、図25に第3の実施形態における処理結果例を示す。この例では、「投稿1」、「投稿4」、「投稿7」、が、投稿公開先「太郎」、およびイベント「誕生祝い」について共通する投稿音声データとして特定されている。
Here, the
続いてSNSサーバ150は、上述のステップs303にて特定した、投稿公開先およびイベントが共通する各投稿音声データにおいて、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索する(s305)。上述の例であれば、SNSサーバ150は、前記各投稿音声データについて、「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定する。この音声解析処理は、SNSサーバ150が備えるプログラム102が備える音声解析プログラムを実行することで実行される。なお、音声解析プログラムは既存のものを利用すればよい。
Subsequently, the
「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定したSNSサーバ150は、図20に例示する如く、該当投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、ないし上述の発話終了時点から投稿音声データにおけるデータ末尾までの不要区間Δt2、のいずれかの音声信号を削除する(s306)。SNSサーバ150は、このステップs306の処理を、上述のステップs305で開始時点ないし終了時点を検索した各投稿音声データについて全て実行する(s307)。
The
次に、SNSサーバ150は、上述のステップs306での不要区間削除の実行後、各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとし(s308)、当該ファイルを再生した再生データをユーザ端末200に送信する(s309)。このように、各投稿音声データをデータ先頭から重畳させることで合成して1ファイルとし、当該ファイルを再生することで、各投稿音声データの同時再生がなされることになる。図21に第3の実施形態の合成再生用ファイルの例1を示す。この図21にて示すように、前記のステップs308で合成して得たファイル、すなわち合成再生用ファイルは、各投稿者の投稿音声データが「けっこんおめでとう」の部分を先頭に多重化されたものとなっている。
Next, after executing unnecessary section deletion in step s306 described above, the
なお、SNSサーバ150は、不要区間削除の実行後、上述のステップs308において、各投稿音声データを、同時に再生終了となるようデータ末尾を揃えて重畳させることで合成して1ファイルとし、前記ステップs309において、当該ファイルを再生した再生データをユーザ端末200に送信するとしてもよい。図22に第3の実施形態の合成再生用ファイルの例2を示す。この場合の合成再生用ファイルは、図22にて示すように、各投稿者の投稿音声データが、「けっこんおめでとう」の部分を後端に揃えて多重化されたものとなっている。
In addition, after execution of unnecessary section deletion, the
上述した例では、投稿音声データのうち、不要区間として削除するのは、データ先頭から選定キーワードの発話開始時点まで、或いは選定キーワードの発話終了時点からデータ末尾まで、としたが、その他にも、図23に示すように、第3の選定キーワードの発話終了時点から、第3の選定キーワードの発話開始時点までの不要区間Δt3を想定するとしてもよい。この場合、SNSサーバ150は、例えば、処理対象の各投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt1,Δt3の削除実行後の各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとする(図24)。或いは、SNSサーバ150は、例えば、処理対象の各投稿音声データにおける上述の発話終了時点からデータ末尾までの不要区間Δt2、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt2,Δt3の削除実行後の各投稿音声データを、データ末尾が揃うよう重畳させることで合成して1ファイルとするとしてもよい。
In the above-described example, the post audio data is deleted as an unnecessary section from the beginning of the data to the start time of the utterance of the selected keyword or from the end time of the utterance of the selected keyword to the end of the data. As shown in FIG. 23, an unnecessary section Δt3 from the end time of the utterance of the third selected keyword to the start time of the utterance of the third selected keyword may be assumed. In this case, for example, the
なお、上述のステップs306において、不要区間の削除を行って得られた投稿音声データの再生時間長が、各投稿音声データ間で大きく異なっているとすれば、上述の合成再生用ファイルを生成して再生したとしても、それを聞いているユーザは発話タイミングがばらばらにずれた内容のメッセージを聞くことになりかねない。 If the playback time length of the posted audio data obtained by deleting the unnecessary section in step s306 is greatly different between the posted audio data, the above-described synthetic playback file is generated. Even if it is played back, the user who listens to it may hear a message whose content is different from the timing of the utterance.
そこで、SNSサーバ150は、上述のステップs308において、不要区間削除実行後の各投稿音声データを重畳させる際、不要区間削除実行後の各投稿音声データ間での再生時間長の平均値を算定し(s308A)、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速の再生速度、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速の再生速度を設定し、各投稿音声データの再生時間長を統一する処理を実行する(s308B)。SNSサーバ150は、当該処理後の各投稿音声データを合成して1ファイルとする。
Therefore, the
こうした第3の実施形態によれば、音声SNSにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達が可能となる。 According to the third embodiment, it is possible to efficiently select and reproduce similar posted voices in the voice SNS without trouble and to transmit the poster intentions in a good manner.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、データ先頭から同時に再生したデータを前記ユーザ端末に送信するものであるとしてもよい。 At least the following will be clarified by the description of the present specification. That is, in the posted sound reproduction control system according to the third embodiment, the calculation unit may transmit data obtained by simultaneously reproducing each posted sound data after execution of the deletion from the data head to the user terminal. Good.
また、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータを前記ユーザ端末に送信するものであるとしてもよい。 Further, in the posted audio reproduction control system according to the third embodiment, the calculation unit transmits data reproduced by aligning the end of the data so that the post audio data after the execution of deletion is completed at the same time. It may be a thing.
また、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、前記各投稿音声データのうち再生時間長が前記平均値に満たないものは基準速度より低速の再生速度を設定し、前記各投稿音声データのうち再生時間長が前記平均値を越えるものは基準速度より高速の再生速度を設定して、前記各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、前記ユーザ端末に送信するものであるとしてもよい。 Further, in the posted audio reproduction control system according to the third embodiment, the calculation unit calculates an average value of reproduction time lengths between the respective post audio data after execution of the deletion, and reproduces the posted audio data. If the time length is less than the average value, a playback speed lower than the reference speed is set, and among the posted audio data, if the playback time length exceeds the average value, a playback speed higher than the reference speed is set. Then, a process for unifying the playback time length of each posted audio data may be executed, and data obtained by simultaneously reproducing each posted audio data after the processing may be transmitted to the user terminal.
1001 音楽選択支援システム(第2の実施形態)
1002 投稿音声再生制御システム(第3の実施形態)
1003 投稿音声再生制御システム(第1の実施形態)
11、101、111 記憶部
12、102、112 プログラム
13、103、113 メモリ
14、104、114 演算部
15、105、115 通信部
16 投稿音声データ
120 インターネット網(ネットワーク)
121 LAN回線(ネットワーク)
122 公衆回線網(ネットワーク)
125 評価テーブル
126 一次評価テーブル
127 二次評価テーブル
128 ユーザテーブル
129 投稿音声データ情報テーブル
130 判定テーブル
131 グルーピングテーブル
132 優先度評価テーブル
133 ユーザテーブル
150 SNSサーバ
160 公開Webサーバ
170 投稿記録装置
200 ユーザ端末
220、230 投稿者端末(ユーザ端末)
240 閲覧再生者端末(ユーザ端末)
300 電話応答システム
310 交換機
320 自動音声応答装置
330 CTI装置
1001 Music selection support system (second embodiment)
1002 Posted Voice Playback Control System (Third Embodiment)
1003 Posted audio playback control system (first embodiment)
11, 101, 111
121 LAN line (network)
122 Public network (network)
125 Evaluation table 126 Primary evaluation table 127 Secondary evaluation table 128 User table 129 Posted audio data information table 130 Determination table 131 Grouping table 132 Priority evaluation table 133 User table 150
240 Browsing player terminal (user terminal)
300
Claims (5)
音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部と、
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理とを実行する演算部と、
を備えることを特徴とする投稿音声再生制御システム。 A communication unit that communicates with a user terminal used by a user of a social network service via a network;
A storage unit that stores identification information of music data and a theme of the corresponding music, and further stores a grouping table in which a keyword of the posted audio data and the corresponding theme are associated;
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A calculation unit that sequentially reproduces each posted audio data included in the group to be continuously reproduced and transmits the reproduced data to the user terminal;
A posted voice reproduction control system comprising:
ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの属性情報と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、
前記演算部は、
前記連続再生対象のグループにおける投稿公開先のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記優先度評価テーブルに照合して、前記ユーザの属性情報に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、
ことを特徴とする請求項1に記載の投稿音声再生制御システム。 The storage unit
A user table describing attribute information of each user of the social network service, and a priority evaluation table in which the attribute information of the user is associated with the playback priority level for continuous playback,
The computing unit is
Read the attribute information related to the user of the posting release destination in the group to be continuously reproduced from the user table, check the attribute information of the user against the priority evaluation table, and reproduce the group according to the attribute information of the user A priority level is specified, a playback order between groups is determined according to the level of the playback priority level, the group to be continuously played back is read from the storage unit in the playback order, and each posted audio data included in the group is read Sequentially reproducing and transmitting the reproduced data to the user terminal,
The posted voice reproduction control system according to claim 1.
各ユーザ端末から受信した投稿音声データを蓄積しているものであり、
ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの投稿内容と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、
前記演算部は、
前記連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記優先度評価テーブルに照合して、前記ユーザの投稿内容に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、
ことを特徴とする請求項1に記載の投稿音声再生制御システム。 The storage unit
It accumulates posted audio data received from each user terminal,
A user table that describes attribute information of each user of the social network service, and a priority evaluation table that associates the user's post content with the playback priority level for continuous playback,
The computing unit is
Reads the latest posted voice data related to the user of the posting release destination in the group to be continuously played from the storage unit, executes voice recognition processing on the corresponding posted voice data, generates text data, and the text data is the priority The playback priority level of the group according to the user's posted content is identified, the playback order between the groups is determined according to the level of the playback priority level, and the continuous playback order is determined according to the playback order. A group to be reproduced is read from the storage unit, each posted audio data included in the group is sequentially reproduced, and the reproduced data is transmitted to the user terminal.
The posted voice reproduction control system according to claim 1.
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、
を実行することを特徴とする投稿音声再生制御方法。 A grouping in which a communication unit that communicates via a network with a user terminal used by a user of a social network service, music data identification information and the corresponding music theme are associated, and a keyword of the posted audio data is associated with the corresponding theme A computer having a storage unit for storing a table;
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A process of sequentially reproducing each posted audio data included in the group to be continuously reproduced, and transmitting the reproduced data to the user terminal;
A method for controlling the reproduction of posted audio, comprising:
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、
を実行させることを特徴とする投稿音声再生制御プログラム。 A grouping in which a communication unit that communicates via a network with a user terminal used by a user of a social network service, music data identification information and the corresponding music theme are associated, and a keyword of the posted audio data is associated with the corresponding theme In a computer having a storage unit for storing a table,
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A process of sequentially reproducing each posted audio data included in the group to be continuously reproduced, and transmitting the reproduced data to the user terminal;
A post voice reproduction control program characterized by causing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012168739A JP5814878B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012168739A JP5814878B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014027614A true JP2014027614A (en) | 2014-02-06 |
JP5814878B2 JP5814878B2 (en) | 2015-11-17 |
Family
ID=50200843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012168739A Active JP5814878B2 (en) | 2012-07-30 | 2012-07-30 | Posted audio playback control system, posted audio playback control method, posted audio playback control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5814878B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021049048A1 (en) * | 2019-09-11 | 2021-03-18 |
-
2012
- 2012-07-30 JP JP2012168739A patent/JP5814878B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021049048A1 (en) * | 2019-09-11 | 2021-03-18 | ||
WO2021049048A1 (en) * | 2019-09-11 | 2021-03-18 | 拓也 木全 | Video-image providing system and program |
JP7153143B2 (en) | 2019-09-11 | 2022-10-13 | 拓也 木全 | Video providing system and program |
Also Published As
Publication number | Publication date |
---|---|
JP5814878B2 (en) | 2015-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4033944B2 (en) | Online karaoke system characterized by recommended music selection function according to music to be played | |
US20150082171A1 (en) | System and Method for Recording and Sharing Music | |
Steffen | From Edison to Marconi: the first thirty years of recorded music | |
Benford et al. | Supporting traditional music-making: designing for situated discretion | |
CN101652808A (en) | Modifying audiovisual output in a karaoke system based on performance context | |
JP5814879B2 (en) | Posted audio playback control system, posted audio playback control method, posted audio playback control program | |
TWI807428B (en) | Method, system, and computer readable record medium to manage together text conversion record and memo for audio file | |
Craft | Headfirst into an Abyss: the Politics and Political reception of Hamilton | |
JP5779938B2 (en) | Playlist creation device, playlist creation method, and playlist creation program | |
JP5937988B2 (en) | Video information distribution system | |
JP2011095437A (en) | Karaoke scoring system | |
JP5814878B2 (en) | Posted audio playback control system, posted audio playback control method, posted audio playback control program | |
Wright | Jaco Pastorius, the electric bass, and the struggle for jazz credibility | |
JP5457791B2 (en) | Karaoke scoring system | |
JP2014026603A (en) | Music selection support system, music selection support method, and music selection support program | |
JP2009180952A (en) | Karaoke system with electronic index book function | |
KR100888341B1 (en) | System and Method for Searching a Sound Source, Server for Searching a Sound Source Therefor | |
JP6027205B2 (en) | Portable information communication terminal and program | |
JP2007121550A (en) | Karaoke contest system capable of reproducing and hearing singing voice of high order prizewinner, karaoke system, and contest server | |
JP6317655B2 (en) | Karaoke system and server | |
Armstrong | Hot collecting off the record: ralph J. Gleason’s start in music journalism | |
US20110077756A1 (en) | Method for identifying and playing back an audio recording | |
JP4331230B2 (en) | Online karaoke system, host device | |
Frisch | Reger’s historicist modernism | |
Van Puymbroeck | Between Genre and Medium: Hilda Tablet, Henry Reed's Fictional Metabiography for Radio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141017 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5814878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |