JP2014027614A - Contribution speech reproduction control system, contribution speech reproduction control method, and contribution speech reproduction control program - Google Patents

Contribution speech reproduction control system, contribution speech reproduction control method, and contribution speech reproduction control program Download PDF

Info

Publication number
JP2014027614A
JP2014027614A JP2012168739A JP2012168739A JP2014027614A JP 2014027614 A JP2014027614 A JP 2014027614A JP 2012168739 A JP2012168739 A JP 2012168739A JP 2012168739 A JP2012168739 A JP 2012168739A JP 2014027614 A JP2014027614 A JP 2014027614A
Authority
JP
Japan
Prior art keywords
posted
data
user
audio data
music
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012168739A
Other languages
Japanese (ja)
Other versions
JP5814878B2 (en
Inventor
Kaori Ohata
佳織 大畑
Koji Aizawa
孝司 相澤
Koichiro Nariai
功一郎 成合
Shinichi Nakane
伸一 仲根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012168739A priority Critical patent/JP5814878B2/en
Publication of JP2014027614A publication Critical patent/JP2014027614A/en
Application granted granted Critical
Publication of JP5814878B2 publication Critical patent/JP5814878B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To successively reproduce multiple contribution speeches in speech SNS and other message services without a sense of discomfort.SOLUTION: A contribution speech reproduction control system comprises: a storage unit 101 for storing therein a grouping table 131 composed of user terminals used by users of social network services and music data identification information and themes correlated with each other; and an arithmetic unit 104 for executing a process in which contribution speech data received from the user terminals having information specifying the same publication destination of contribution added thereto is identified, a reference is made to the grouping table 131 for the information added to each of the identified contribution speech data to identify music to be reproduced simultaneously with the contribution speech data, and the theme of music to be reproduced simultaneously with each of the contribution speech data is identified, and items of contribution speech data mutually having the identified theme in common are stored in the storage unit 101 as a group to be successively reproduced, and a process in which each contribution speech data included in the group to be successively reproduced are sequentially reproduced and transmitted to the user terminals.

Description

本発明は、投稿音声再生制御システム、投稿音声再生制御方法、投稿音声再生制御プログラムに関するものであり、具体的には、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とする技術に関する。   The present invention relates to a posted audio playback control system, a posted audio playback control method, and a posted audio playback control program. Specifically, a plurality of posted audio in a message service such as an audio SNS is continuously played back without feeling uncomfortable. TECHNICAL FIELD OF THE INVENTION

昨今、従来から存在するテキストベースのSNS(Social Network Service)に加え、音声メッセージの投稿、公開がなされる音声SNSが登場し、広がりを見せている。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。こうした音声SNSにおいては、投稿が音声であるが故の様々な新サービスの展開が想定される。例えば、音源らを関連づけて再生する既存技術として、ツリー型の音声掲示板システムにおいて、ある音声メッセージに複数のフォロー音声メッセージがついている場合に、音声メッセージを再生した後、いずれのフォロー音声メッセージを選択するかを決定するサーバ装置(特許文献1参照)などが提案されている。   In recent years, in addition to the existing text-based SNS (Social Network Service), voice SNSs for posting and publishing voice messages have appeared and are spreading. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved. In such a voice SNS, it is assumed that various new services will be developed because the posting is voice. For example, as an existing technology for playing back sound sources in association with each other, in a tree-type voice bulletin board system, if there are multiple follow voice messages attached to a voice message, select any follow voice message after playing the voice message A server device (see Patent Document 1) for determining whether to do so has been proposed.

特開2008−092495号公報JP 2008-092495 A

上述した音声SNS等のメッセージサービスにおいて、つながりある他ユーザの投稿音声を聞くユーザが、単純に投稿順で各投稿音声を順次再生した場合、投稿音声間のテーマや雰囲気の相違により、投稿音声が示すメッセージをスムーズに理解できず、感情移入しにくいという問題点がある。特に、音声SNS上において他ユーザとのつながりが多いユーザであるほど、多種多様な投稿音声をシリアルに再生して、そうした問題点が大きくなり、ひいてはユーザビリティの低下が懸念される。   In a message service such as the above-mentioned voice SNS, when a user who listens to the posted voices of other connected users simply plays each posted voice sequentially in the order of posting, the posted voices may differ depending on the theme or atmosphere between the posted voices. There is a problem that the message shown cannot be understood smoothly and it is difficult to empathize. In particular, as the user has more connections with other users on the voice SNS, a variety of posted voices are serially reproduced, and such a problem becomes greater, and there is a concern that usability may be lowered.

そこで本発明の目的は、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とする技術を提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide a technique for continuously reproducing a plurality of posted voices in a message service such as a voice SNS without a sense of incongruity and enabling a good transmission of a poster's intention.

上記課題を解決する本発明の投稿音声再生制御システムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部と、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理とを実行する演算部と、を備えることを特徴とする。   The posted audio reproduction control system of the present invention that solves the above problems associates a communication unit that communicates with a user terminal used by a user of a social network service via a network, music data identification information, and a corresponding music theme. In addition, the storage unit for storing the grouping table in which the keyword of the posted audio data and the corresponding theme are associated with each other and the posted audio data received from the user terminal via the communication unit are assigned the same posting publication destination designation information. The identification information of the music to be played back simultaneously with the corresponding posted voice data, which is given to each identified posted voice data, is collated with the grouping table, and should be played back simultaneously with each posted voice data The music theme is specified, and posted audio data with the specified theme shared with each other A calculation unit that performs a process of storing the stored data as a group in a storage unit and a process of sequentially reproducing each posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. It is characterized by providing.

また、本発明の投稿音声再生制御方法は、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータが、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、を実行することを特徴とする。   Further, the posted audio reproduction control method of the present invention relates to a communication unit that communicates via a network with a user terminal used by a user of a social network service, the identification information of music data, and the theme of the corresponding music, and further posting A computer having a storage unit storing a grouping table in which a keyword of audio data is associated with a corresponding theme is given the same post release destination designation information among the posted audio data received from the user terminal via the communication unit The identification information of the music to be played back simultaneously with the corresponding posted audio data, which is given to each identified posted audio data, is collated with the grouping table and reproduced simultaneously with each posted audio data Specify the theme of the music to be played, and continuously play back the posted audio data that share the specified theme. And a process of storing each of the posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. To do.

また、本発明の投稿音声再生制御プログラムは、ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータに、前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、を実行させることを特徴とする。   The posted audio reproduction control program of the present invention associates a communication unit that communicates with a user terminal used by a user of a social network service via a network, music data identification information, and a corresponding music theme, and further posts Designated information of the same posting release destination is given to the computer having a storage unit that stores a grouping table in which a keyword of the audio data and the corresponding theme are associated with each other from the posted audio data received from the user terminal via the communication unit. The identification information of the music to be played back simultaneously with the corresponding posted audio data, which is given to each identified posted audio data, is collated with the grouping table and reproduced simultaneously with each posted audio data Identifies the theme of the music that should be performed, and continues the posted audio data that share the specified theme A process of storing in a storage unit as a raw target group, and a process of sequentially reproducing each posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal. Features.

本発明によれば、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達が可能となる。   According to the present invention, a plurality of posted voices in a message service such as a voice SNS can be continuously reproduced without a sense of incongruity, and a good transmission of a poster's intention can be achieved.

第1の実施形態の投稿音声再生制御システムを含むネットワーク構成図である。It is a network block diagram containing the contribution audio | voice reproduction | regeneration control system of 1st Embodiment. 第1の実施形態のSNSサーバのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the SNS server of 1st Embodiment. 第1の実施形態の公開Webサーバのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the public Web server of 1st Embodiment. 第1の実施形態の投稿記録装置のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the posting recording apparatus of 1st Embodiment. 第1の実施形態のグルーピングテーブルの一例を示す図である。It is a figure which shows an example of the grouping table of 1st Embodiment. 第1の実施形態の優先度評価テーブルの一例を示す図である。It is a figure which shows an example of the priority evaluation table of 1st Embodiment. 第1の実施形態のユーザテーブルの一例を示す図である。It is a figure which shows an example of the user table of 1st Embodiment. 第1の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。It is a flowchart which shows the process sequence example of the contribution audio | voice reproduction | regeneration control method in 1st Embodiment. 第1の実施形態における評価結果例を示す図である。It is a figure which shows the example of an evaluation result in 1st Embodiment. 第2の実施形態のSNSサーバのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the SNS server of 2nd Embodiment. 第2の実施形態の評価テーブルの一例を示す図である。It is a figure which shows an example of the evaluation table of 2nd Embodiment. 第2の実施形態のユーザテーブルの一例を示す図である。It is a figure which shows an example of the user table of 2nd Embodiment. 第2の実施形態の投稿音声データ情報テーブルの一例を示す図である。It is a figure which shows an example of the contribution audio | voice data information table of 2nd Embodiment. 第2の実施形態の音楽選択支援方法の処理手順例を示すフロー図である。It is a flowchart which shows the process sequence example of the music selection assistance method of 2nd Embodiment. 第2の実施形態における評価結果例1を示す図である。It is a figure which shows the evaluation result example 1 in 2nd Embodiment. 第2の実施形態における評価結果例2を示す図である。It is a figure which shows the evaluation result example 2 in 2nd Embodiment. 第3の実施形態のSNSサーバのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the SNS server of 3rd Embodiment. 第3の実施形態の判定テーブルの一例を示す図である。It is a figure which shows an example of the determination table of 3rd Embodiment. 第3の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。It is a flowchart which shows the process sequence example of the contribution audio | voice reproduction | regeneration control method in 3rd Embodiment. 第3の実施形態の投稿音声データの例1を示す図である。It is a figure which shows Example 1 of the contribution audio | voice data of 3rd Embodiment. 第3の実施形態の合成再生用ファイルの例1を示す図である。It is a figure which shows Example 1 of the file for synthetic | combination reproduction | regeneration of 3rd Embodiment. 第3の実施形態の合成再生用ファイルの例2を示す図である。It is a figure which shows Example 2 of the file for synthetic | combination reproduction | regeneration of 3rd Embodiment. 第3の実施形態の投稿音声データの例2を示す図である。It is a figure which shows Example 2 of the contribution audio | voice data of 3rd Embodiment. 第3の実施形態の合成再生用ファイルの例3を示す図である。It is a figure which shows Example 3 of the file for synthetic | combination reproduction | regeneration of 3rd Embodiment. 第3の実施形態における処理結果例を示す図である。It is a figure which shows the example of a process result in 3rd Embodiment.

−−−第1の実施形態におけるシステム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、第1の実施形態における投稿音声再生制御システム1003を含むネットワーク構成図である。図1に示す投稿音声再生制御システム1003(以下、システム1003)は、音声SNS等のメッセージサービスにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the first embodiment ---
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a network configuration diagram including a posted audio reproduction control system 1003 according to the first embodiment. A posted voice reproduction control system 1003 (hereinafter, system 1003) shown in FIG. 1 is a computer system that continuously reproduces a plurality of posted voices in a message service such as a voice SNS without a sense of incongruity and enables good transmission of a poster's intention. is there.

なお、音声SNSとは、従来から存在するテキストベースのSNSとは異なり、音声メッセージの投稿、公開がなされるSNSである。音声SNSでは、ユーザの音声投稿すなわち肉声を、SNS内で該当ユーザとつながりを持つ他ユーザが聞くことで、ユーザ間の感情豊かでリアリティあるコミュニケーションが図られることになる。   Note that the voice SNS is an SNS in which a voice message is posted and released, unlike a conventional text-based SNS. In the voice SNS, a user's voice posting, that is, a real voice is heard by another user having a connection with the corresponding user in the SNS, so that emotional and realistic communication between the users is achieved.

図1に例示するシステム1003は、SNSサーバ150、公開Webサーバ160、および投稿記録装置170で構成されている。SNSサーバ150は、音声SNSに関する各種処理の主たる実行主体であり、音声SNSのユーザに関する認証情報や、各ユーザの投稿音声データの情報などを管理し、ユーザ認証や投稿音声の公開、再生といった処理を実行するサーバ装置となる。また、公開Webサーバ160は、インターネット網120を介してアクセスしてくるユーザ端末200と、上述のSNSサーバ150との間にあって、SNSサーバ150でのユーザ認証処理や、上述のSNSサーバ150が出力した、投稿音声データの再生データなど各種データの授受を仲介するサーバ装置である。また、投稿記録装置170は、ユーザ端末200から送られてくる投稿音声データを格納する情報処理装置であり、SNSサーバ150からの要求に応じて、当該要求が指定する投稿音声データを読み出してSNSサーバ150に送るものとなる。   A system 1003 illustrated in FIG. 1 includes an SNS server 150, a public Web server 160, and a posting recording device 170. The SNS server 150 is a main execution subject of various processes related to the voice SNS, manages authentication information related to users of the voice SNS, information of posted voice data of each user, and processes such as user authentication and published voice playback and playback. It becomes the server device which executes. The public Web server 160 is located between the user terminal 200 accessed via the Internet network 120 and the above-described SNS server 150. The user authentication process in the SNS server 150 and the output from the above-described SNS server 150 are output. The server device mediates exchange of various data such as reproduction data of posted audio data. The posting recording device 170 is an information processing device that stores posted voice data sent from the user terminal 200. In response to a request from the SNS server 150, the posted recording data 170 reads out the posted voice data specified by the request. This is sent to the server 150.

なお、SNSサーバ150では、ソーシャルネットワークサービスの形態として当然ながら、ユーザ毎に、当該音声SNS上でのつながり(例:友人、知人、同僚、家族、一方的なフォロワー、趣味・嗜好等のグループなど)が規定された他ユーザの情報が管理されている。従って、ユーザが再生して聞くことが出来る投稿音声は、こうしたつながりを持った他ユーザのものとなる。そのため、投稿記録装置170では、ユーザ毎に、該当ユーザ宛て乃至該当グループ宛等に投稿された他ユーザの投稿音声データを紐付けて管理している。   Of course, in the SNS server 150, as a form of the social network service, for each user, a connection on the voice SNS (eg, friend, acquaintance, colleague, family, unilateral follower, hobby / preference group, etc.) ) Is managed for other users. Therefore, the posted voice that can be reproduced and heard by the user is that of another user having such a connection. Therefore, in the posting recording device 170, for each user, the posted audio data of other users posted to the corresponding user or the corresponding group is linked and managed.

公開Webサーバ160およびSNSサーバ150は、ユーザ端末200(投稿者端末220、閲覧再生者端末240)からのアクセスに際し、所定のユーザ認証処理を経てアクセスユーザを特定し、該当ユーザに紐付けて投稿記録装置170にて管理している他ユーザからの投稿音声データの情報(例:投稿ユーザ名、投稿日時、タイトル、録音長等)を、該当ユーザ用のページ(SNSサイトにおける、いわゆるマイページ)にて、例えば投稿日時順に列挙するように設定し、このページデータを該当ユーザ端末200に送信することとなる。   The public Web server 160 and the SNS server 150 specify an access user through a predetermined user authentication process when accessing from the user terminal 200 (the contributor terminal 220 and the browsing player terminal 240), and post it in association with the corresponding user. Information on posted audio data from other users managed by the recording device 170 (e.g., posting user name, posting date / time, title, recording length, etc.), a page for the corresponding user (so-called my page on the SNS site) Then, for example, the page data is set to be listed in order of posting date and time, and the page data is transmitted to the corresponding user terminal 200.

公開Webサーバ160が、前記のユーザ用ページにて、所定投稿についての再生指示をユーザ端末200から受けた場合、公開Webサーバ160は該当投稿に関する再生指示の情報をSNSサーバ150に送る。SNSサーバ150ではこの再生指示の情報を受けて、該当投稿に関する投稿音声データを投稿記録装置170から読み出して再生し、その再生データを公開Webサーバ160を介してユーザ端末200に送信する。ユーザ端末200では、この再生データをインターネット網120を介して受信し、スピーカーで出力する。   When the public Web server 160 receives a playback instruction for a predetermined post from the user terminal 200 on the user page, the public Web server 160 sends information on the playback instruction regarding the post to the SNS server 150. The SNS server 150 receives this reproduction instruction information, reads the posted audio data related to the corresponding posting from the posting recording device 170 and reproduces it, and transmits the reproduced data to the user terminal 200 via the public Web server 160. The user terminal 200 receives this reproduction data via the Internet network 120 and outputs it through a speaker.

一方、音声SNSのユーザが利用する端末がユーザ端末200である。このユーザ端末200は、例えば図1にて示すように、投稿者端末220、230、閲覧再生者端末240に分類できる。投稿者端末220は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示すると共に、自ユーザによる投稿音声の入力をマイクで受け付けて、対応する投稿音声データを公開Webサーバ160にアップロードする端末となる。また、閲覧再生者端末240は、インターネット網120を介して公開Webサーバ160にアクセスし、当該公開Webサーバ160にて公開されている音声SNSのWebサイトのデータを取得、表示する端末となる。   On the other hand, the terminal used by the user of the voice SNS is the user terminal 200. For example, as shown in FIG. 1, the user terminal 200 can be classified into contributor terminals 220 and 230 and a browsing player terminal 240. The poster terminal 220 accesses the public Web server 160 via the Internet network 120, acquires and displays the data of the voice SNS website published on the public Web server 160, and the posted voice by the own user. Is input to the public Web server 160 by accepting the input by the microphone. Further, the browsing player terminal 240 is a terminal that accesses the public Web server 160 via the Internet network 120 and acquires and displays data of the website of the voice SNS published on the public Web server 160.

なお、投稿者端末220、閲覧再生者端末240が公開Webサーバ160にアクセスする場合、当然ながら、音声SNSにおける自分用のページにログインするためのユーザ認証処理が必要となる。従って、投稿者端末220、閲覧再生者端末240では、利用中のユーザによる認証情報の入力を受け付けて、これを認証依頼と共に、公開Webサーバ160を介してSNSサーバ150に送信する。この場合、SNSサーバ150は、前記の認証情報を、認証用の情報を格納したデータベース等に照合してユーザ認証を実行し、その認証結果に応じて、該当投稿者端末220や閲覧再生者端末240からの公開Webサーバ160における該当ユーザ用ページへのアクセス可否を制御する。また、SNSサーバ150は、前記の認証結果を公開Webサーバ160を介して投稿者端末220や閲覧再生者端末240に送信する。   In addition, when the contributor terminal 220 and the browsing player terminal 240 access the public Web server 160, of course, a user authentication process for logging in to a page for oneself in the voice SNS is necessary. Therefore, the contributor terminal 220 and the browsing / playback terminal 240 accept input of authentication information by a user in use, and transmit this to the SNS server 150 via the public Web server 160 together with an authentication request. In this case, the SNS server 150 performs user authentication by collating the authentication information with a database or the like that stores authentication information, and according to the authentication result, the corresponding contributor terminal 220 or the browsing player terminal. The access to the corresponding user page in the public Web server 160 from 240 is controlled. Further, the SNS server 150 transmits the authentication result to the poster terminal 220 and the browsing player terminal 240 via the public Web server 160.

また、上述したように、投稿音声データやその再生データの授受等をインターネット網120を介して行う場合の他に、ユーザ端末200の電話機能と、公衆回線網122らを用いて投稿音声データやその再生データの授受等を行う形態も想定できる。この場合、図1にて示すように、上述のSNSサーバ150や投稿記録装置170にLAN回線121を介して接続する電話応答システム300がネットワーク構成に含まれる。   Further, as described above, in addition to the case where the posting voice data and its reproduction data are exchanged via the Internet network 120, the posting voice data and the like using the telephone function of the user terminal 200 and the public line network 122, etc. It is also possible to assume a form in which the reproduction data is exchanged. In this case, as shown in FIG. 1, the network configuration includes a telephone answering system 300 connected to the SNS server 150 and the post recording device 170 via the LAN line 121.

この電話応答システム300は、交換機310、自動音声応答装置320、CTI(Computer Telephony Integration)装置330から構成されている。そのうち交換機310は、電話回線を相互接続し電話網を構成するための交換機であり、自動音声応答装置320は、電話の応答と音声による情報の入出力や対話をコンピュータにて行う装置であり、CTI装置330は、電話やFAXをコンピュータシステムに統合する装置である。   The telephone response system 300 includes an exchange 310, an automatic voice response device 320, and a CTI (Computer Telephony Integration) device 330. Among them, the exchange 310 is an exchange for interconnecting telephone lines to form a telephone network, and the automatic voice response device 320 is a device that performs a telephone response and voice information input / output and dialogue with a computer, The CTI device 330 is a device that integrates a telephone or a fax into a computer system.

こうした構成において、ユーザ端末たる投稿者端末230より、予め定められた投稿受付電話番号へ発話がなされた場合、上述の投稿者端末230は、公衆回線網122を経て交換機310へ接続され、この接続に応じて、CTI装置330での発話番号取得や自動応答装置320での自動音声ガイダンス再生がなされる。その後、上述の投稿者端末230において、投稿者がメッセージを発話した場合、その発話メッセージは自動音声応答装置320を経て、投稿音声データとして投稿記録装置170に録音、すなわち登録される。また、この投稿音声データの登録処理にあわせ、自動音声応答装置320が、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を、SNSサーバ150に通知する。SNSサーバ150では、この通知を受けて、投稿記録装置170に登録された投稿音声データの情報(投稿者、投稿日時、投稿音声データの識別情報等)を記憶部に格納することとなる。   In such a configuration, when an utterance is made from a contributor terminal 230, which is a user terminal, to a predetermined post acceptance telephone number, the contributor terminal 230 is connected to the exchange 310 via the public network 122, and this connection In response to this, an utterance number is acquired by the CTI device 330 and automatic voice guidance reproduction is performed by the automatic response device 320. Thereafter, in the above-described poster terminal 230, when the poster utters a message, the uttered message is recorded, that is, registered in the post recording device 170 as post voice data through the automatic voice response device 320. Also, in accordance with the posted voice data registration process, the automatic voice response device 320 uses the SNS to record the posted voice data information (poster, posted date, posted voice data identification information, etc.) registered in the posted recording device 170. The server 150 is notified. In response to this notification, the SNS server 150 stores the posted voice data information registered in the posting recording device 170 (poster, posted date and time, identification information of the posted voice data, etc.) in the storage unit.

続いて、システム1003のハードウェア構成について説明する。第1の実施形態におけるシステム1003は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。まずは、システム1003における処理の実行主体たるSNSサーバ150について説明を行うこととする。   Next, the hardware configuration of the system 1003 will be described. As described above, the system 1003 according to the first embodiment includes the SNS server 150, the public Web server 160, and the posting recording device 170. First, the SNS server 150 that is the execution subject of processing in the system 1003 will be described.

この場合、システム1003を構成するSNSサーバ150は、図2に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第1の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、グルーピングテーブル131、優先度評価テーブル132、およびユーザテーブル133が少なくとも記憶されている。これらテーブルの詳細については後述する。   In this case, as illustrated in FIG. 2, the SNS server 150 configuring the system 1003 includes a storage unit 101 including an appropriate non-volatile storage device such as a hard disk drive, and a memory 103 including a volatile storage device such as a RAM. The computer 102, which reads and executes the program 102 held in the storage unit 101, executes the overall control of the apparatus itself and performs various determinations, computations, and control processes, and the LAN unit 121, etc. A communication unit 105 connected and responsible for communication processing with other devices. The storage unit 101 stores at least a program 102, a grouping table 131, a priority evaluation table 132, and a user table 133 for implementing functions necessary for the posted audio reproduction control system of the first embodiment. ing. Details of these tables will be described later.

また、公開Webサーバ160も同様に、図3に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部111、RAMなど揮発性記憶装置で構成されるメモリ113、前記記憶部111に保持されるプログラム112をメモリ113に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部114、インターネット網120、LAN回線121と接続し他装置との通信処理を担う通信部115、を備える。なお、記憶部111内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム112、および、音声SNSサイトの各種Webページデータ116が少なくとも記憶されている。   Similarly, as illustrated in FIG. 3, the public Web server 160 also includes a storage unit 111 configured with an appropriate non-volatile storage device such as a hard disk drive, a memory 113 configured with a volatile storage device such as RAM, and the storage. An arithmetic unit 114 such as a CPU, an Internet network 120, a LAN line 121, and the like that read and execute a program 112 held in the unit 111 to the memory 113 and execute overall control of the apparatus itself and perform various determinations, calculations, and control processes A communication unit 115 connected and responsible for communication processing with other devices. In the storage unit 111, a program 112 for implementing necessary functions in cooperation with the SNS server 150 as the posted audio reproduction control system of the first embodiment, and various Web page data 116 of the audio SNS site. Is at least remembered.

また、投稿記録装置170も同様に、図4に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部11、RAMなど揮発性記憶装置で構成されるメモリ13、前記記憶部11に保持されるプログラム12をメモリ13に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部14、LAN121と接続し他装置との通信処理を担う通信部15、を備える。なお、記憶部11内には、第1の実施形態の投稿音声再生制御システムとしてSNSサーバ150と協働し必要な機能を実装する為のプログラム12、および、各ユーザ端末200(投稿者端末220、230)から受信した投稿音声データ16が少なくとも記憶されている。投稿音声データ16には、各投稿音声データのファイル(ファイル名が識別情報ともなる)と、該当投稿音声の投稿者、投稿日時、公開先、および該当投稿音声データと共に再生するBGMの識別情報といったデータが対応付けて格納されている(図4)。   Similarly, as illustrated in FIG. 4, the posting recording device 170 also includes a storage unit 11 configured with an appropriate non-volatile storage device such as a hard disk drive, a memory 13 configured with a volatile storage device such as RAM, and the storage. The program 12 held in the unit 11 is executed by reading the program 12 into the memory 13 to perform overall control of the device itself and perform various determinations, computations, and control processes, and the arithmetic unit 14 such as a CPU and the LAN 121 to connect with other devices. The communication part 15 which bears a communication process is provided. In the storage unit 11, the program 12 for implementing necessary functions in cooperation with the SNS server 150 as the posted audio reproduction control system of the first embodiment, and each user terminal 200 (the poster terminal 220). , 230) is at least stored. The posted audio data 16 includes a file of each posted audio data (the file name is also identification information), a contributor of the corresponding posted audio, a posting date / time, a publication destination, and identification information of the BGM to be reproduced together with the corresponding posted audio data. Data is stored in association with each other (FIG. 4).

続いて、第1の実施形態のシステム1003が備える機能について説明する。第1の実施形態におけるシステム1003は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1003として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1003において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。   Next, functions provided in the system 1003 of the first embodiment will be described. As described above, the system 1003 in the first embodiment is configured by the SNS server 150, the public Web server 160, and the posting recording device 170. However, for the sake of simplification of description, the SNS server 150 is described below. The description will be made on the assumption that the functions of the public Web server 160 and the post recording device 170 are provided and the functions of the integrated system 1003 are achieved. In such a system 1003, data exchange with the user terminal 200 is executed via the public Web server 160, and post audio data management is executed via the post recording device 170.

この場合、システム1003は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データのうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定し、該当投稿音声データに同時再生すべき音楽が付与されている場合は、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を、一方、該当投稿音声データに同時再生すべき音楽が付与されていない場合は、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部101に格納する機能を有している。   In this case, the system 1003 has the same post release destination designation information (for example, identification information of the user or group as the release destination) in the post voice data obtained and stored by the post recording device 170 from the user terminal 200. What is given is accessed and specified via the communication unit 105 from the posting recording device 170, and if the music to be played back simultaneously is given to the corresponding posted voice data, the given posted voice data is given Identification information of music that should be played back simultaneously with the corresponding posted voice data, and if the music to be played back simultaneously is not given to the posted voice data, voice recognition is performed for each of the specified posted voice data The process is executed to generate text data, and the generated text data is collated with the grouping table 131 to obtain the theme ( : Birthday, identifies the wedding, etc.), and has a function of storing in the storage unit 101 posts the audio data et al themes the identified common with each other as a group to be continuously played back.

また、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を有している。   In addition, the system 1003 has a function of sequentially reproducing each posted audio data included in the group to be continuously reproduced and transmitting the reproduced data to the user terminal 200.

なお、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出し、このユーザの属性情報を優先度評価テーブル132に照合して、ユーザの属性情報に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。   Note that the system 1003 reads attribute information (for example, birthday, music orientation, hobbies, age, etc.) related to the posting disclosure destination user in the group to be continuously reproduced from the user table 133, and evaluates the attribute information of this user on the priority evaluation. The reproduction priority level of the group corresponding to the attribute information of the user is identified with reference to the table 132, the reproduction order between the groups is determined according to the level of the reproduction priority level, and the group subject to continuous reproduction in the reproduction order May be provided from the storage unit 101, the posted audio data included in the group may be sequentially reproduced, and the reproduced data may be transmitted to the user terminal 200.

また、システム1003は、連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データ16を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを優先度評価テーブル132に照合して、ユーザの投稿内容に応じたグループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で連続再生対象のグループを記憶部101より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する機能を備えるとしてもよい。   In addition, the system 1003 displays the latest posted audio data 16 related to the user of the posting disclosure destination in the group to be continuously played back to the posting recording device 170 (or the storage unit 101 that has copied the posted audio data 16 from the posting recording device 170). Read out, execute speech recognition processing on the corresponding posted voice data to generate text data, collate the text data with the priority evaluation table 132, and set the playback priority level of the group according to the user's posted content. The playback order between the groups is determined in accordance with the level of the playback priority level, the group to be continuously played back is read from the storage unit 101 in the playback order, and each posted audio data included in the group is played back sequentially. A function of transmitting the reproduced data to the user terminal 200 may be provided.

なお、システム1003は、上述の投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを記憶部101にて設定する機能を備えるとしてもよい。この場合、システム1003は、連続再生対象のグループに含まれる各投稿音声データを順次再生する際、上述のフラグが設定されているテーマに対応した連続再生対象のグループについては再生をせず、他の連続再生対象のグループの再生を優先する。   In addition, when the system 1003 receives a reproduction stop instruction from the user terminal 200 that has received the corresponding reproduction data via the communication unit 105 during the reproduction of the posted audio data, the system 1003 receives the group theme of the corresponding continuous reproduction target. With regard to the above, a function may be provided in which the storage unit 101 sets a flag for designating the exclusion of a reproduction target for a certain period. In this case, when the system 1003 sequentially plays back each posted audio data included in the group to be continuously played back, the system 1003 does not play back the group to be played back continuously corresponding to the theme for which the above flag is set. Priority is given to the playback of groups that are subject to continuous playback.

−−−第1の実施形態におけるデータ構造例−−−
次に、第1の実施形態のシステム1003が用いるテーブルにおけるデータ構造例について説明する。図5は、第1の実施形態のグルーピングテーブル131の一例を示す図である。このグルーピングテーブル131は、「バースデイソング」、「ウェディングソング」といったBGM名、すなわち音楽データの識別情報をキーとして、投稿音声を音声認識により生成したテキストキーワード、「お祝い系」、「元気系」といった該当音楽または投稿音声のテーマ、および「楽しい」、「明るい」といったトーン(曲調)とを対応付けたレコードの集合体となっている。
--- Example of data structure in the first embodiment ---
Next, an example of a data structure in a table used by the system 1003 of the first embodiment will be described. FIG. 5 is a diagram illustrating an example of the grouping table 131 according to the first embodiment. The grouping table 131 includes BGM names such as “birthday song” and “wedding song”, that is, text keywords generated by voice recognition using the identification information of music data as keys, “celebration”, “genki”, and the like. It is a collection of records in which the theme of the corresponding music or posted audio and the tone (musical tone) such as “fun” and “bright” are associated with each other.

図6は第1の実施形態の優先度評価テーブル132の一例を示す図である。また、優先度評価テーブル132は、ユーザの属性情報(例:誕生日等)ないし投稿内容(例:結婚、試合等)と、連続再生対象の再生優先レベルとを対応付けたレコードの集合体となっている。図6における優先度評価テーブル132の例では、連続再生対象のグループの公開先であるユーザの属性情報(例:誕生日等)ないし直近の投稿内容(例:結婚、試合等)が、当該優先度評価テーブル132におけるユーザ属性ないし投稿内容の項目値にマッチした場合、該当連続再生対象のグループに付与される所定の評価得点の値が規定されたテーブルとなっている。   FIG. 6 is a diagram illustrating an example of the priority evaluation table 132 according to the first embodiment. In addition, the priority evaluation table 132 includes a collection of records in which user attribute information (eg, birthday, etc.) or post content (eg, marriage, match, etc.) is associated with a playback priority level to be continuously played back. It has become. In the example of the priority evaluation table 132 in FIG. 6, the attribute information (eg, birthday) of the user who is the disclosure destination of the group to be continuously reproduced or the latest posted content (eg, marriage, match, etc.) This table defines a predetermined evaluation score value to be given to the group to be subjected to continuous reproduction when the user attribute or the post content item value in the degree evaluation table 132 is matched.

図7は第1の実施形態のユーザテーブル133の一例を示す図である。また、ユーザテーブル133は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。   FIG. 7 is a diagram illustrating an example of the user table 133 according to the first embodiment. Further, the user table 133 is a table describing attribute information of each user of the voice SNS. In the example of the figure, user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user using the user ID as a key. It is a collection of records that correspond to each other.

−−−第1の実施形態における処理手順例−−−
以下、第1の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1003を構成する各装置らがメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the first embodiment ---
Hereinafter, the actual procedure of the posted audio reproduction control method in the first embodiment will be described with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read out from a memory or the like and executed by each device constituting the system 1003. And this program is comprised from the code | cord | chord for performing the various operation | movement demonstrated below.

図8は、第1の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、投稿記録装置170がユーザ端末200から得て格納している投稿音声データ16のうち、同じ投稿公開先の指定情報(例:公開先となるユーザやグループの識別情報)が付与されているものを、投稿記録装置170より通信部105を介しアクセスして特定する(s100)。   FIG. 8 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the first embodiment. Here, the SNS server 150 specifies the same posting publication destination designation information (for example, identification information of a user or a group serving as a publication destination) in the posted voice data 16 obtained and stored by the posting recording device 170 from the user terminal 200. ) Is specified from the posting recording device 170 via the communication unit 105 (s100).

また、SNSサーバ150は、上述のステップs100で特定された当該投稿音声データに同時再生すべき音楽が付与されているか否かを判定し(s101)、付与されている場合、特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報をグルーピングテーブル131に照合して、各投稿音声データと同時再生すべき音楽のテーマ(例:誕生日祝い、結婚祝い等)やトーンを特定する(s102)。この場合、SNSサーバ150は、投稿記録装置170にて該当投稿音声データ16に関して付与されている、「バースデイソング」といったBGMの識別情報を読み取り、当該BGMの識別情報をグルーピングテーブル131に照合して、該当投稿音声データと同時再生すべき音楽のテーマを「お祝い系」、トーンを「楽しい・明るい」などと特定することになる。なお、各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報は、後述する第2の実施形態における音楽選択支援システム1001により特定され、投稿記録装置170にて投稿音声データに付与されたものであると想定する。   In addition, the SNS server 150 determines whether or not music to be simultaneously reproduced is added to the posted audio data specified in step s100 described above (s101). The identification information of the music to be reproduced simultaneously with the corresponding posted audio data, which is given to the data, is collated with the grouping table 131, and the music theme to be reproduced simultaneously with each posted audio data (eg birthday celebration, wedding celebration) Etc.) and a tone are specified (s102). In this case, the SNS server 150 reads the BGM identification information such as “birthday song” given to the corresponding posted audio data 16 in the posting recording device 170 and collates the BGM identification information with the grouping table 131. The music theme to be played simultaneously with the corresponding posted audio data is specified as “celebration”, the tone as “fun / bright”, and the like. Note that the identification information of the music to be played back simultaneously with the corresponding posted voice data, which is given to each posted voice data, is specified by the music selection support system 1001 in the second embodiment to be described later, and is posted by the posting recording device 170. Assume that it is given to the posted audio data.

また、上述のステップs100で特定された当該投稿音声データに同時再生すべき音楽が付与されていない場合、当該特定した各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを、グルーピングテーブル131に照合して、各投稿音声データのテーマ(例:誕生日祝い、結婚祝い等)を特定する(s103)。   If the music to be played back simultaneously is not given to the posted audio data specified in step s100 described above, a speech recognition process is performed on each specified posted audio data to generate text data, The generated text data is collated with the grouping table 131, and the theme (for example, birthday celebration, wedding celebration, etc.) of each posted audio data is specified (s103).

続いてSNSサーバ150は、上述のステップs102またはs103で特定したテーマ、好ましくは更にトーンも互いに共通する投稿音声データらを、連続再生対象のグループとして記憶部101に格納する(s104)。SNSサーバ150における、この投稿音声データのグルーピングの処理は、上述のステップs100で特定した全ての投稿音声データに関して処理完了するまで繰り返し実行することとなる(s105)。図9に示す評価結果例では、同一公開先の投稿音声データとして、「投稿1」〜「投稿7」までの7つの投稿が特定され、それら各投稿に紐付けされていたBGMの識別情報が「BGM1:バースデイソング」、「BGM2:応援歌」、「BGM3:卒業ソング」、「BGM4:バースデイソング」、「BGM5:卒業ソング」、「BGM6:バレンタインソング」、「BGM7:BGMなし」であり、それらのテーマに基づくグループは、「投稿1:お祝い系」、「投稿2:元気系」、「投稿3:お別れ系」、「投稿4:お祝い系」、「投稿5:お別れ系」、「投稿6:お祝い系」、「投稿7:お祝い系」と分類された。   Subsequently, the SNS server 150 stores, in the storage unit 101, the theme specified in the above-described step s102 or s103, and preferably the posted voice data having the same tone as the group to be continuously reproduced (s104). The grouping process of the posted voice data in the SNS server 150 is repeatedly executed until the process is completed for all the posted voice data specified in step s100 described above (s105). In the evaluation result example shown in FIG. 9, seven posts from “post 1” to “post 7” are specified as post voice data of the same publication destination, and the identification information of the BGM linked to each post is shown. “BGM1: Birthday Song”, “BGM2: Support Song”, “BGM3: Graduation Song”, “BGM4: Birthday Song”, “BGM5: Graduation Song”, “BGM6: Valentine Song”, “BGM7: No BGM” The groups based on these themes are “Post 1: Celebration”, “Post 2: Energetic”, “Post 3: Farewell”, “Post 4: Celebration”, “Post 5: Farewell” , “Post 6: Congratulatory”, “Post 7: Congratulatory”.

次に、SNSサーバ150は、上述の連続再生対象のグループにおける投稿公開先のユーザに関する属性情報(例:誕生日、音楽志向、趣味、年齢等)をユーザテーブル133より読み出す(s106)。また、SNSサーバ150は、前記グループにおける投稿公開先のユーザに関する直近の投稿音声データ16(直近から一定期間遡った複数件であってもよい)を、投稿記録装置170(ないし投稿記録装置170から予めの投稿音声データ16をコピーした記憶部101)より読み出し、該当投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s107)。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。   Next, the SNS server 150 reads attribute information (eg, birthday, music orientation, hobbies, age, etc.) related to the posting disclosure user in the group to be continuously reproduced from the user table 133 (s106). In addition, the SNS server 150 obtains the latest posted audio data 16 (may be a plurality of items retroactive for a certain period from the latest) from the posting recording device 170 (or the posting recording device 170). The storage unit 101), which is a copy of the posted audio data 16 in advance, is read out, the speech recognition program included in the program 102 is activated for the corresponding posted audio data, and the speech recognition process is executed to generate text data (s107). Here, it is assumed that the SNS server 150 includes a voice recognition program as part of the program 102 for the voice recognition processing.

SNSサーバ150は、上述のステップs106,s107で得た、前記ユーザの属性情報およびテキストデータ(すなわち直近の投稿内容)を、優先度評価テーブル132に照合し、これらユーザの属性情報および直近の投稿内容に応じて、該当グループの再生優先レベルを特定する(s108)。   The SNS server 150 collates the user attribute information and text data (that is, the latest post content) obtained in the above steps s106 and s107 with the priority evaluation table 132, and the user attribute information and the latest post According to the content, the playback priority level of the corresponding group is specified (s108).

図9に示す評価結果例の場合、投稿公開先のユーザの属性情報が、「誕生日:2月」であり、また、当該ユーザによる直近の投稿内容が「明日はサッカーの試合のあと、誕生日パーティだ!」、「週末はバレンタイン」、「来月で卒業。さみしいなあ」であった。そのため、「投稿1」〜「投稿7」の各投稿のうち、「投稿1」については、その投稿内容が「7歳の誕生日おめでとう」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿2」については、その投稿内容が「明日の試合がんばろう」であるから、"試合"なるキーワードについて「10点」獲得し、該当グループの「元気系」にこの10点を加算する。また、「投稿3」については、その投稿内容が「もうすぐ卒業式、高校は別々で寂しいね」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿4」については、その投稿内容が「ハッピーバースディ。もう7才。大きくなったね」であるから、"バースデイ"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿5」については、その投稿内容が「卒業してもまたみんなで遊ぼう」であるから、"卒業"なるキーワードについて「10点」獲得し、該当グループの「お別れ系」にこの10点を加算する。また、「投稿6」については、その投稿内容が「バレンタインチョコ作りで忙しいよう」であるから、"バレンタイン"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。また、「投稿7」については、その投稿内容が「今日の誕生日会はみんなにお祝いしてもらって楽しかった」であるから、"誕生日"なるキーワードについて「10点」獲得し、該当グループの「お祝い系」にこの10点を加算する。   In the case of the evaluation result example shown in FIG. 9, the attribute information of the posting release destination user is “birthday: February”, and the latest posted content by the user is “birth tomorrow after a soccer game, "It was a party!", "Valentine on the weekend", "Graduated next month. Therefore, among the posts from “Post 1” to “Post 7”, “Post 1” has a post content of “Happy Birthday for 7 years old”. ”And add these 10 points to the“ festive ”group. For “Post 2”, the content of the post is “Let's do our best tomorrow's game”, so “10 points” are acquired for the keyword “Game”, and these 10 points are added to the “Genki” of the corresponding group. To do. In addition, as for “Post 3”, the content of the post is “Soon graduation ceremony, high school is separate and lonely”, so we get “10” for the keyword “Graduation” and “Farewell” of the corresponding group Add these 10 points to. Also, for “Post 4”, the content of the post is “Happy Birthday. Already 7 years old. You ’ve grown up”, so earned “10 points” for the keyword “Birthday” and made it a “Celebration” for that group. Add these 10 points. Also, for “Post 5”, the content of the post is “Let's play together even after graduation”, so “10 graduation” is obtained for the keyword “Graduation”, and it becomes “Farewell” of the corresponding group. Add these 10 points. Also, for “Post 6”, the content of the post is “It seems to be busy with Valentine's day chocolate making”, so “10 points” are obtained for the keyword “Valentine”, and this 10 points are given to the “festive group” of the corresponding group. to add. Also, for “Post 7”, the content of the post is “Today ’s birthday party was fun to be celebrated by everyone”, so “10 points” were obtained for the keyword “Birthday” and These 10 points are added to the “celebration”.

各グループの得点は、「投稿1」、「投稿4」、「投稿6」、「投稿7」から10点づつ得たお祝い系が合計40点となり、「投稿2」からのみ10点得た元気計が合計10点となり、「投稿3」、「投稿5」から10点づつ得たお別れ系が合計20点となった。従って、SNSサーバ150は、こうして得た各グループの総得点が高いものほど、再生優先レベルが高いと判定し、これに応じてグループ間の再生順序を、再生順序1位:お祝い系、再生順序2位:お別れ系、再生順序3位:元気系、と決定する(s109)。   The score of each group is 40 points in total for 10 points from “Post 1”, “Post 4”, “Post 6”, “Post 7”, and 10 points from “Post 2”. The total was 10 points, and the farewell system obtained 10 points from “Post 3” and “Post 5” was 20 points in total. Accordingly, the SNS server 150 determines that the higher the total score of each group obtained in this way is, the higher the playback priority level is. Accordingly, the playback order between the groups is set as the playback order first: festive system, playback order. 2nd place: Farewell system, reproduction order 3rd place: Energetic system is determined (s109).

続いてSNSサーバ150は、上述のステップs109で決定した再生順序で、該当連続再生対象のグループを、投稿記録装置170(ないし投稿記録装置170から投稿音声データをコピーした記憶部101)より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータをユーザ端末200に送信する(s110)。   Subsequently, the SNS server 150 reads out the corresponding continuous playback target group from the posting recording device 170 (or the storage unit 101 that has copied the posted audio data from the posting recording device 170) in the playback order determined in step s109 described above, Each posted audio data included in the group is sequentially reproduced, and the reproduced data is transmitted to the user terminal 200 (s110).

なお、SNSサーバ150は、上述のステップs110における投稿音声データの再生時に、該当再生データを受信しているユーザ端末200より、再生停止指示を通信部105を介して受信した場合(s111:Yes)、該当連続再生対象のグループのテーマに関して、一定期間の再生対象排除を指定するフラグを、記憶部101にて設定するとしてもよい(s112)。このステップs112の処理後のSNSサーバ150は、後に、ステップs110を再度実行するに際し、上述のフラグが設定されているテーマに対応した連続再生対象のグループについて、該当フラグの示す有効期間内の間は、再生をせず、他の連続再生対象のグループのうち再生順序が早いものから再生を優先する。このような処理を行うこととすれば、システム1003側で決定した再生順序を、ユーザが好ましく思わなかった事実を確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。   Note that the SNS server 150 receives a reproduction stop instruction from the user terminal 200 that has received the corresponding reproduction data via the communication unit 105 when reproducing the posted audio data in step s110 described above (s111: Yes). In addition, regarding the theme of the group that is the target of continuous playback, a flag that designates playback target exclusion for a certain period may be set in the storage unit 101 (s112). When the SNS server 150 after the processing of step s112 later executes step s110 again, the SNS server 150 is within the effective period indicated by the corresponding flag for the group to be continuously played back corresponding to the theme for which the flag is set. Does not reproduce, but prioritizes the reproduction from the group with the highest reproduction order among the other groups subject to continuous reproduction. If such processing is performed, the playback order determined on the system 1003 side is based on the fact that the user did not like it, and it is possible to continuously play back the posted audio data more in line with the user's intention and mood. It becomes possible.

また、SNSサーバ150は、上述のフラグの起源である再生停止指示を行ったユーザ毎に、前記フラグの設定履歴を該当グループと対応付けて記憶部101にて保持しておくとしてもよい。この場合、SNSサーバ150は、該当ユーザに関して、各グループでのフラグ設定頻度を一定期間毎に算定し、グループ間でフラグ設定頻度が最高となったものについて、以後再びフラグが設定される際には、フラグの有効期間すなわち再生対象排除の期間を通常より一定期間延長するといった処理を実行する。このような処理を行うこととすれば、ユーザが好ましく思わなかった事実を更に確実に踏まえて、よりユーザの意向、気分に沿った投稿音声データの連続再生が可能となる。   The SNS server 150 may store the flag setting history in the storage unit 101 in association with the corresponding group for each user who has given a playback stop instruction that is the origin of the flag. In this case, the SNS server 150 calculates the flag setting frequency in each group for each user for a certain period, and when the flag setting frequency is highest among the groups, the flag is set again thereafter. Performs a process of extending the effective period of the flag, that is, the period of exclusion of the reproduction target by a certain period from the normal period. By performing such processing, it is possible to continuously reproduce the posted audio data more in line with the user's intention and mood, more reliably based on the fact that the user did not like.

以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。   Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.

こうした第1の実施形態によれば、音声SNSにおける複数の投稿音声を違和感無く連続再生し、投稿者意図の良好な伝達が可能となる。   According to the first embodiment, it is possible to continuously reproduce a plurality of posted voices in the voice SNS without a sense of incongruity, and to appropriately transmit the poster intention.

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第1の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの属性情報と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記優先度評価テーブルに照合して、前記ユーザの属性情報に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。   At least the following will be clarified by the description of the present specification. That is, in the posted audio reproduction control system according to the first embodiment, the storage unit includes a user table describing attribute information of each user of the social network service, user attribute information, and a reproduction priority level for continuous reproduction. An associated priority evaluation table, wherein the calculation unit reads attribute information related to a posting release destination user in the group to be continuously reproduced from the user table, and the attribute information of the user is read from the priority evaluation table. The playback priority level of the group according to the attribute information of the user is determined, the playback order between the groups is determined according to the level of the playback priority level, and the continuous playback target in the playback order is determined. Read the group from the storage unit, play each post audio data included in the group sequentially, Data is the one that transmits to the user terminal may be.

また、第1の実施形態の投稿音声再生制御システムにおいて、前記記憶部は、各ユーザ端末から受信した投稿音声データを蓄積しているものであり、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの投稿内容と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、前記演算部は、前記連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記優先度評価テーブルに照合して、前記ユーザの投稿内容に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、としてもよい。   In the posted audio playback control system according to the first embodiment, the storage unit stores posted audio data received from each user terminal, and describes attribute information of each user of the social network service. A user table, and a priority evaluation table that associates the user's posted content with the playback priority level of the continuous playback target, and the calculation unit includes the latest user related post posting destination in the group of the continuous playback target Read the posted voice data from the storage unit, execute voice recognition processing on the corresponding posted voice data to generate text data, check the text data against the priority evaluation table, and according to the user's posted content The playback priority level of the group is specified, and the playback order between groups is determined according to the level of the playback priority level. The continuous playback target group is read from the storage unit in the playback order, each posted audio data included in the group is sequentially played back, and the played back data is transmitted to the user terminal. Good.

−−−第2の実施形態におけるシステム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。第2の実施形態の音楽選択支援システム1001を含むネットワーク構成は、第1の実施形態におけるネットワーク構成(図1)と同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第2の実施形態における音楽選択支援システム1001(以下、システム1001)は、音声SNS(Social Network Service)での投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図るコンピュータシステムである。
--- System configuration in the second embodiment ---
Embodiments of the present invention will be described below in detail with reference to the drawings. The network configuration including the music selection support system 1001 of the second embodiment is the same as the network configuration (FIG. 1) in the first embodiment. Therefore, only the configuration different from that of the first embodiment will be described below. A music selection support system 1001 (hereinafter, system 1001) according to the second embodiment efficiently selects music with respect to a posted voice in a voice SNS (Social Network Service), and thus improves usability in the voice SNS. It is a computer system that aims to.

続いてシステム1001のハードウェア構成について説明する。第2の実施形態におけるシステム1001は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。ここでは、システム1001における処理の実行主体たるSNSサーバ150について説明を行うこととする。   Next, the hardware configuration of the system 1001 will be described. As described above, the system 1001 according to the second embodiment includes the SNS server 150, the public Web server 160, and the posting recording device 170. Here, the SNS server 150 that is the execution subject of processing in the system 1001 will be described.

この場合、システム1001を構成するSNSサーバ150は、図10に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第2の実施形態の音楽選択支援システムとして必要な機能を実装する為のプログラム102、評価テーブル125、ユーザテーブル128、および、投稿音声データ情報テーブル129が少なくとも記憶されている。なお、評価テーブル125は、一次評価テーブル126と二次評価テーブル127から構成されている。   In this case, as illustrated in FIG. 10, the SNS server 150 configuring the system 1001 includes a storage unit 101 including an appropriate nonvolatile storage device such as a hard disk drive, and a memory 103 including a volatile storage device such as a RAM. The computer 102, which reads and executes the program 102 held in the storage unit 101, executes the overall control of the apparatus itself and performs various determinations, computations, and control processes, and the LAN unit 121, etc. A communication unit 105 connected and responsible for communication processing with other devices. The storage unit 101 stores at least a program 102 for implementing functions necessary for the music selection support system of the second embodiment, an evaluation table 125, a user table 128, and a posted audio data information table 129. Has been. The evaluation table 125 includes a primary evaluation table 126 and a secondary evaluation table 127.

続いて、第2の実施形態のシステム1001が備える機能について説明する。第2の実施形態におけるシステム1001は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1001として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1001において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。   Next, functions provided in the system 1001 of the second embodiment will be described. As described above, the system 1001 according to the second embodiment includes the SNS server 150, the public Web server 160, and the posting recording device 170. However, for the sake of simplification of description, the SNS server 150 is described below. The description will be made on the assumption that the functions of the public Web server 160 and the post recording device 170 are provided and the functions of the integrated system 1001 are achieved. In such a system 1001, data exchange with the user terminal 200 is executed via the public Web server 160, and post audio data management is executed via the post recording device 170.

この場合、システム1001は、ユーザ端末200から受信した投稿音声データ(投稿記録装置170で格納されているもの)に対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する機能を有している。ここで、SNSサーバ150は、この音声認識処理のため、プログラム102の一部として、音声認識プログラムを備えているものとする。   In this case, the system 1001 activates a speech recognition program included in the program 102 and executes speech recognition processing on the posted speech data (stored in the posted recording device 170) received from the user terminal 200, and the text It has a function to generate data. Here, it is assumed that the SNS server 150 includes a voice recognition program as part of the program 102 for the voice recognition processing.

また、システム1001は、上述の音声認識処理で生成したテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有している。ここで、システム1001は、マッチ度が最も高い選定キーワード群を特定するとしてもよい。他方、ユーザ端末200では、この推奨情報を受信してディスプレイにて表示し、ユーザに閲覧させる。   Further, the system 1001 collates the text data generated by the above-described voice recognition processing with each selected keyword group in the evaluation table 125, and specifies a selected keyword group whose degree of matching with the keyword included in the text data is a predetermined value or more. The music data identification information corresponding to the specified selected keyword group is transmitted to the user terminal 200 as recommended music information to be reproduced together with the posted voice data. Here, the system 1001 may specify a selected keyword group having the highest degree of matching. On the other hand, the user terminal 200 receives the recommended information, displays it on the display, and allows the user to browse.

ユーザが上述の推奨情報の示す音楽を容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。SNSサーバ150は、容認通知を受信した音楽のデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信することとなる。或いは、上述の如き、システム1001は、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   When the user accepts the music indicated by the recommended information, the user terminal 200 notifies the SNS server 150 via the public Web server 160. The SNS server 150 reproduces the music data (retained in the posting recording device 170 or its own storage unit 101) that has received the acceptance notification together with the corresponding posted voice data, and the reproduced data is displayed on the public Web server 160. To the user terminal 200. Alternatively, as described above, the system 1001 does not transmit the recommended information to the user terminal 200, but reproduces the music data corresponding to the specified selected keyword group together with the posted audio data, and the reproduced data is reproduced. It may have a function of transmitting to the user terminal 200.

また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、すなわち、マッチ度最高のものが並存していた場合、ユーザ端末200のユーザに関する属性情報をユーザテーブル128より読み出し、ユーザの属性情報を評価テーブル125の各ユーザ属性に照合して、ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。当然この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   Further, the system 1001 collates the above-described text data with each selected keyword group of the evaluation table 125 and specifies a plurality of selected keyword groups having the highest matching degree with the keyword included in the text data, that is, the highest matching degree. If the user attribute information exists, the attribute information related to the user of the user terminal 200 is read from the user table 128, the user attribute information is collated with each user attribute of the evaluation table 125, and the degree of match with the user attribute information is The highest user attribute may be specified, and the music data identification information corresponding to the specified user attribute may be transmitted to the user terminal 200 as recommended music information to be reproduced together with the posted audio data. . Of course, also in this case, the system 1001 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the music data corresponding to the specified user attribute together with the posted audio data, and the reproduced data. May be transmitted to the user terminal 200.

また、システム1001は、マッチ度が最も高い選定キーワード群を複数特定した場合に、該当投稿音声データに、ソーシャルネットワークサービスにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する機能を有しているとしてもよい。   Further, the system 1001 has a function of determining whether or not designation information of a public destination (such as a user or a group) in the social network service is given to the corresponding posted voice data when a plurality of selected keyword groups having the highest matching degree are specified. It is good also as having.

この場合、システム1001は、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合、該当指定情報が示す投稿公開先のユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿公開先のユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   In this case, when the system 1001 determines that the post publishing destination designation information is attached to the corresponding posted audio data as a result of the determination, the system 1001 determines from the user table 128 regarding the post publishing destination user indicated by the corresponding designation information. The attribute information is read out, the attribute information is compared with each user attribute in the evaluation table 125, the user attribute having the highest degree of matching with the attribute information of the posting destination user is identified, and the music corresponding to the identified user attribute The data identification information may be transmitted to the user terminal 200 as music recommendation information to be reproduced together with the posted audio data. Also in this case, the system 1001 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the music data corresponding to the specified user attribute together with the posted audio data, and the reproduced data is reproduced. It may have a function of transmitting to the user terminal 200.

一方、前記の判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合、システム1001は、該当投稿音声データの投稿ユーザに関して、ユーザテーブル128から属性情報を読み出し、当該属性情報を評価テーブル125の各ユーザ属性に照合して、投稿ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する処理を実行するものとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定したユーザ属性に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   On the other hand, as a result of the determination, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data, the system 1001 reads the attribute information from the user table 128 regarding the posting user of the corresponding posted audio data. The attribute information is collated with each user attribute of the evaluation table 125, the user attribute having the highest degree of matching with the attribute information of the posting user is identified, and the music data identification information corresponding to the identified user attribute is posted. A process of transmitting to the user terminal 200 as recommended information of music to be reproduced together with the audio data may be executed. Also in this case, the system 1001 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the music data corresponding to the specified user attribute together with the posted audio data, and the reproduced data is reproduced. It may have a function of transmitting to the user terminal 200.

また、システム1001は、上述のテキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近の投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、該当投稿音声データに対し、上述同様の音声認識処理を実行してテキストデータを生成し、当該テキストデータを評価テーブル125の各選定キーワード群に照合して、テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   In addition, when the system 1001 collates the above-described text data with each selected keyword group in the evaluation table 125 and specifies a plurality of selected keyword groups that have the highest degree of matching with the keyword included in the text data, the user of the user terminal 200 The latest posted voice data relating to the post-recording device 170 or the storage unit 101 is read out, the corresponding posted voice data is subjected to voice recognition processing similar to the above to generate text data, and the text data is stored in the evaluation table 125. Match each selected keyword group, identify the selected keyword group that has the highest degree of matching with the keyword included in the text data, and play the music data identification information corresponding to the identified selected keyword group together with the posted audio data A function to transmit to the user terminal 200 as recommended music information It may be used as is. Also in this case, the system 1001 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the music data corresponding to the specified selected keyword group together with the posted audio data, and the reproduced data May be transmitted to the user terminal 200.

また、システム1001は、上述のテキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、ユーザ端末200のユーザに関する直近から所定範囲の期間の各投稿音声データを、投稿記録装置170ないし記憶部101より読み出し、各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出し、当該キーワードを評価テーブル125の各選定キーワード群に照合して、出現頻度一定以上のキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報としてユーザ端末200に送信する機能を有しているとしてもよい。この場合も、システム1001は、上述の如きユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応する音楽データを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信する機能を有しているとしてもよい。   In addition, when the system 1001 specifies a plurality of selected keyword groups having the highest degree of matching with the keyword included in the text data, each posted audio data for a period within a predetermined range from the most recent time related to the user of the user terminal 200 is recorded. Read from the device 170 or the storage unit 101, execute the speech recognition process similar to the above on each posted voice data to generate text data, extract keywords with a frequency of appearance above a certain level across each text data, The keyword is collated with each selected keyword group of the evaluation table 125, the selected keyword group having the highest degree of matching with the keyword having a certain appearance frequency or more is specified, and the identification information of the music data corresponding to the specified selected keyword group, It is transmitted to the user terminal 200 as recommended information of music to be reproduced together with the posted audio data. Functions may have. Also in this case, the system 1001 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the music data corresponding to the specified selected keyword group together with the posted audio data, and the reproduced data May be transmitted to the user terminal 200.

−−−第2の実施形態におけるデータ構造例−−−
次に、第2の実施形態のシステム1001が用いるテーブルにおけるデータ構造例について説明する。図11は第2の実施形態の評価テーブル125の一例を示す図である。評価テーブル125は、音楽データの識別情報と該当音楽データに関して予め選定された選定キーワード群とを対応付けたテーブルであり、第2の実施形態では、一次評価テーブル126と二次評価テーブル127とで構成している。図に示す例では、一次評価テーブル126は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定された、「たんじょうび」、「ばーすでい」、「はっぴー」、などといった選定キーワード群とを対応付けたレコードの集合体となっている。また、二次評価テーブル127は、音楽データの識別情報たるBGM名をキーとして、該当音楽データすなわちBGMに関して予め選定されたユーザ属性(例:誕生日当日、ロック音楽好き、40代)、および直近書込みが含むキーワード(例:結婚、クリスマス等)を対応付けたレコードの集合体となっている。
--- Example of data structure in the second embodiment ---
Next, an example of a data structure in a table used by the system 1001 according to the second embodiment will be described. FIG. 11 is a diagram illustrating an example of the evaluation table 125 according to the second embodiment. The evaluation table 125 is a table in which identification information of music data is associated with a selection keyword group selected in advance for the corresponding music data. In the second embodiment, the evaluation table 125 includes a primary evaluation table 126 and a secondary evaluation table 127. It is composed. In the example shown in the figure, the primary evaluation table 126 uses “BGM name” as music data identification information as a key, and “musical information”, “basile”, “ha” selected in advance for the corresponding music data, that is, BGM. It is a collection of records in which selected keyword groups such as “ppy” are associated. Further, the secondary evaluation table 127 uses the BGM name as identification information of music data as a key, the user attributes (for example, birthday date, rock music enthusiast, 40s) selected in advance for the corresponding music data, that is, the BGM, and the latest It is a collection of records that associate keywords (eg, marriage, Christmas, etc.) included in writing.

図12は第2の実施形態のユーザテーブル128の一例を示す図である。ユーザテーブル128は、音声SNSの各ユーザの属性情報を記述したテーブルであり、図の例では、ユーザIDをキーとして、該当ユーザの誕生日、音楽志向、趣味、年齢といったユーザ属性の値を対応付けたレコードの集合体となっている。   FIG. 12 is a diagram illustrating an example of the user table 128 according to the second embodiment. The user table 128 is a table in which attribute information of each user of the voice SNS is described. In the example of the figure, the user attribute values such as the birthday, music orientation, hobbies, and age of the corresponding user are associated with the user ID as a key. It is a collection of attached records.

図13は第2の実施形態の投稿音声データ情報テーブル129の一例を示す図である。投稿音声データ情報テーブル129は、投稿記録装置170に格納されている投稿音声データに関する情報を、該当投稿音声データの公開先毎に格納したテーブルであり、図の例では、「U00001」といったユーザID毎に、投稿音声データIDをキーとして、該当投稿音声データの投稿者、投稿日時、投稿音声データのタイトル(識別情報)といった値を対応付けたレコードの集合体となっている。   FIG. 13 is a diagram illustrating an example of the posted audio data information table 129 according to the second embodiment. The posted audio data information table 129 is a table in which information related to posted audio data stored in the posting recording device 170 is stored for each disclosure destination of the corresponding posted audio data. In the example of the figure, a user ID such as “U00001” is stored. Each is a set of records in which values such as a contributor of the corresponding posted audio data, a posting date and time, and a title (identification information) of the posted audio data are associated with the posted audio data ID as a key.

−−−第2の実施形態における処理手順例−−−
以下、第2の実施形態における音楽選択支援方法の実際手順について図に基づき説明する。以下で説明する音楽選択支援方法に対応する各種動作は、システム1001を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the second embodiment ---
Hereinafter, the actual procedure of the music selection support method in the second embodiment will be described with reference to the drawings. Various operations corresponding to the music selection support method described below are realized by programs that are read into the memory and executed by the devices constituting the system 1001. And this program is comprised from the code | cord | chord for performing the various operation | movement demonstrated below.

図14は、第2の実施形態における音楽選択支援方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信して投稿記録装置170に格納された投稿音声データを、投稿記録装置170より取得する(s200)。   FIG. 14 is a flowchart showing a processing procedure example of the music selection support method according to the second embodiment. Here, the SNS server 150 acquires the posted voice data received from the user terminal 200 and stored in the posting recording device 170 from the posting recording device 170 (s200).

次に、SNSサーバ150は、上述で取得した投稿音声データに対し、プログラム102が含む音声認識プログラムを起動して音声認識処理を実行し、テキストデータを生成する(s201)。ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、一次評価テーブル126における、各BGMの選定キーワード群に照合して、テキストデータが含むキーワードと各BGMとのマッチ度を算定する(s202)。   Next, the SNS server 150 activates a speech recognition program included in the program 102 for the posted speech data acquired above, executes speech recognition processing, and generates text data (s201). Here, the SNS server 150 collates the text data generated by the speech recognition process with the selected keyword group of each BGM in the primary evaluation table 126, and calculates the degree of match between the keyword included in the text data and each BGM. (S202).

このように、テキストデータが含むキーワードと各BGMとのマッチ度を算定する処理は、例えば次のような処理手順となる。テキストデータが含むキーワードが、「けっこん」、「おめでとう」、「しあわせ」であった場合、SNSサーバ150は、これらキーワードを一次評価テーブル126に照合し、「けっこん」のキーワードについては、適合時得点の「10点」を特定し、「おめでとう」のキーワードについては、適合時得点の「6点」を特定し、「しあわせ」のキーワードについては、適合時得点の「6点」を特定する。こうした、「けっこん」、「おめでとう」、「しあわせ」の各キーワードに関する適合時得点の特定処理を、一次評価テーブル126における各BGMのレコードについて実行し(s203)、図15に示す評価結果例1のように、各BGM毎の得点計を算定する。図15の例では、"BGM2:ウェディングソング"について最高得点「19点」が算定された。   As described above, the process for calculating the degree of matching between the keyword included in the text data and each BGM is, for example, the following processing procedure. When the keywords included in the text data are “Kekkon”, “Congratulations”, and “Happiness”, the SNS server 150 matches these keywords with the primary evaluation table 126, and for the keyword “Kekkon”, the score at the time of adaptation “10 points” is specified, “6 points” of the score for adaptation is specified for the keyword “congratulations”, and “6 points” of the score for adaptation is specified for the keyword “happy”. The identification process of the score at the time of matching for each of the keywords “Kekkon”, “Congratulations”, and “happiness” is executed for each BGM record in the primary evaluation table 126 (s203), and the evaluation result example 1 shown in FIG. Thus, the score meter for each BGM is calculated. In the example of FIG. 15, the highest score “19 points” was calculated for “BGM2: wedding song”.

このように、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが1つのみ特定された場合(s204:No)、SNSサーバ150は、特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者のユーザ端末200に送信する(s205)。該当投稿音声データの投稿者情報は勿論のこと、公開先は、投稿音声データの投稿時に投稿者が指定しており、公開先となったユーザないしグループの情報が該当投稿音声データに付帯して投稿記録装置170や投稿音声データ情報テーブル129に格納されているものとする。   As described above, only the keyword with the highest degree of matching with the keyword included in the text data, that is, the keyword group with the highest score = BGM is specified by the matching of the keyword of the text data to the primary evaluation table 126 and the score calculation process. In the case (No at s204), the SNS server 150 uses the identified BGM, that is, the identification information of the music data, as the recommended music information to be reproduced together with the posted audio data, to the user terminal 200 of the poster of the corresponding posted audio data. Transmit (s205). The posting destination is specified by the contributor at the time of posting the posted audio data, as well as the poster information of the corresponding posted audio data, and the information of the user or group that became the publishing destination is attached to the corresponding posted audio data. It is assumed that they are stored in the posting recording device 170 and the posted audio data information table 129.

なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。   Note that the user terminal 200 that has received the recommended information described above displays the recommended information on a display and allows the user to browse. When the user accepts the BGM indicated by the recommended information described above, the fact is notified from the user terminal 200 to the SNS server 150 via the public Web server 160.

SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。なお、SNSサーバ150は、上述の如き、ユーザ端末200への推奨情報の送信を行わず、前記特定した選定キーワード群に対応するBGMのデータを、投稿音声データと合わせて再生し、当該再生したデータをユーザ端末200に送信するとしてもよい。   The SNS server 150 reproduces the BGM data (held in the posting recording device 170 or its own storage unit 101) that has received the acceptance notification from the user terminal 200 together with the corresponding posted audio data, and discloses the reproduced data. It transmits to the user terminal 200 via the Web server 160 (s212). Note that the SNS server 150 does not transmit the recommended information to the user terminal 200 as described above, but reproduces the BGM data corresponding to the specified selected keyword group together with the posted voice data, and reproduces the data. Data may be transmitted to the user terminal 200.

一方、一次評価テーブル126へのテキストデータのキーワードの照合と得点算定の処理により、テキストデータが含むキーワードとのマッチ度最高のもの、つまり最高得点のキーワード群=BGMが複数特定された場合(s204:Yes)、SNSサーバ150は、該当投稿音声データに、音声SNSにおける公開先(ユーザやグループ等)の指定情報が付与されているか判定する(s206)。   On the other hand, when the matching of the keywords of the text data to the primary evaluation table 126 and the score calculation process specify a plurality of keywords having the highest degree of matching with the keywords included in the text data, that is, the highest score keyword group = BGM (s204). : Yes), the SNS server 150 determines whether or not the designated information of the disclosure destination (user, group, etc.) in the voice SNS is given to the corresponding posted voice data (s206).

この場合、SNSサーバ150は、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合(s206:Yes)、該当指定情報が示す「投稿公開先」のユーザに関して、ユーザテーブル128から属性情報を読み出す(s207)。このステップs207において、SNSサーバ150は、更に、「投稿公開先」のユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。   In this case, if the SNS server 150 determines that the post publishing destination designation information is added to the corresponding posted audio data as a result of the determination in step s206 described above (s206: Yes), the corresponding designation information indicates “ The attribute information is read from the user table 128 for the user of “post publication destination” (s207). In step s207, the SNS server 150 further reads the latest posted voice data related to the user of “post publication destination” from the posting recording device 170, executes voice recognition processing on the corresponding posted voice data, and performs text data processing. Is generated. When the SNS server 150 reads the latest posted voice data from the posting recording device 170, the SNS server 150 may read the posted voice data in a predetermined range from the latest. In that case, the SNS server 150 generates the text data by executing the same voice recognition processing as described above for each posted voice data in the period of the predetermined range, and selects a keyword having a certain appearance frequency across each text data. Extract.

他方、上述のステップs206での判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合(s206:No)、SNSサーバ150は、該当投稿音声データの「投稿」ユーザに関して、ユーザテーブル128から属性情報を読み出す(s208)。このステップs208において、SNSサーバ150は、更に、「投稿」ユーザに関する直近の投稿音声データを、投稿記録装置170より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成する。SNSサーバ150は、直近の投稿音声データを投稿記録装置170から読み出す際、直近から所定範囲の期間の投稿音声データを読み出すものとしてもよい。その場合、SNSサーバ150は、所定範囲の期間の各投稿音声データに対し上述と同様の音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出する。   On the other hand, as a result of the determination in the above-described step s206, when it is determined that the post publishing destination designation information is not given to the corresponding posted audio data (s206: No), the SNS server 150 displays “post” of the corresponding posted audio data. ”Regarding the user, the attribute information is read from the user table 128 (s208). In step s208, the SNS server 150 further reads the latest posted voice data related to the “post” user from the posting recording device 170, executes voice recognition processing on the corresponding posted voice data, and generates text data. . When the SNS server 150 reads the latest posted voice data from the posting recording device 170, the SNS server 150 may read the posted voice data in a predetermined range from the latest. In that case, the SNS server 150 generates the text data by executing the same voice recognition processing as described above for each posted voice data in the period of the predetermined range, and selects a keyword having a certain appearance frequency across each text data. Extract.

続いてSNSサーバ150は、上述のステップs207、s208のいずれかで得た、ユーザの属性情報および直近書込みから得たキーワードを、二次評価テーブル127に照合し、各BGMに関して規定されているユーザの属性情報およびキーワードとのマッチ度を算定する(s209)。   Subsequently, the SNS server 150 collates the user attribute information obtained in any of the above-described steps s207 and s208 and the keyword obtained from the latest writing with the secondary evaluation table 127, and the user defined for each BGM. The degree of matching with the attribute information and the keyword is calculated (s209).

このように、ユーザの属性情報およびキーワードと、各BGMとのマッチを算定する処理は、例えば次のような処理手順となる。ユーザの属性情報が「年齢:40」、「音楽志向:ロック」であり、キーワードが、「フットサル」、「がんばろう」であった場合、SNSサーバ150は、これらの値を二次評価テーブル127に照合し、「年齢:40」、「音楽志向:ロック」の各値については適合時得点の「10点」をそれぞれ特定し、「フットサル」、「がんばろう」の各キーワードについては、適合時得点無しを特定する。こうした、ユーザの属性情報およびキーワードに関する適合時得点の特定処理を、二次評価テーブル127における各BGMのレコードについて実行し(s210)、図16に示す評価結果例2のように、各BGM毎の得点計を算定する。   As described above, the process for calculating the match between the user attribute information and the keyword and each BGM is, for example, the following processing procedure. When the attribute information of the user is “age: 40”, “music-oriented: rock”, and the keywords are “futsal” and “good luck”, the SNS server 150 uses these values as the secondary evaluation table 127. For each value of “Age: 40” and “Music Orientation: Rock”, specify “10 points” at the time of adaptation, and for each keyword of “Futsal” and “Good luck” at the time of adaptation Specify no score. The process of specifying the matching score for the user attribute information and the keyword is executed for each BGM record in the secondary evaluation table 127 (s210), and as shown in the evaluation result example 2 shown in FIG. Calculate the score meter.

図16の例では、一次評価テーブル126を用いた評価で最高得点となった"BGM4"、"BGM5"、"BGM6"、のうち、二次評価テーブル127を用いた評価で、"BGM6"に計20点が算定された。このように、二次評価テーブル127へのユーザの属性情報およびキーワードの照合と得点算定の処理により、ユーザの属性情報およびキーワードとのマッチ度最高のもの、つまり最高得点のBGMを特定する。   In the example of FIG. 16, among the “BGM4”, “BGM5”, and “BGM6” that have the highest score in the evaluation using the primary evaluation table 126, the evaluation using the secondary evaluation table 127 is changed to “BGM6”. A total of 20 points were calculated. In this way, by matching the user attribute information and keywords to the secondary evaluation table 127 and processing for score calculation, the BGM having the highest degree of match with the user attribute information and keywords, that is, the highest score BGM is specified.

続いてSNSサーバ150は、上述のステップs205と同様に、上述のステップs209で特定したBGMつまり音楽データの識別情報を、投稿音声データと合わせて再生する音楽の推奨情報として、該当投稿音声データの投稿者のユーザ端末200に送信する(s211)。なお、上述の推奨情報を受信したユーザ端末200は、推奨情報をディスプレイに表示して、ユーザに閲覧させることとなる。ユーザが上述の推奨情報の示すBGMを容認した場合、その旨がユーザ端末200から公開Webサーバ160を介してSNSサーバ150に通知される。   Subsequently, as in step s205 described above, the SNS server 150 uses the BGM identified in step s209, that is, music data identification information, as the recommended music information to be reproduced together with the posted audio data, It transmits to the user terminal 200 of a contributor (s211). Note that the user terminal 200 that has received the recommended information described above displays the recommended information on a display and allows the user to browse. When the user accepts the BGM indicated by the recommended information described above, the fact is notified from the user terminal 200 to the SNS server 150 via the public Web server 160.

SNSサーバ150は、ユーザ端末200から容認通知を受信したBGMのデータ(投稿記録装置170ないし自身の記憶部101にて保持)を、該当投稿音声データと合わせて再生し、当該再生したデータを公開Webサーバ160を介してユーザ端末200に送信する(s212)。   The SNS server 150 reproduces the BGM data (held in the posting recording device 170 or its own storage unit 101) that has received the acceptance notification from the user terminal 200 together with the corresponding posted audio data, and discloses the reproduced data. It transmits to the user terminal 200 via the Web server 160 (s212).

以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。   Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the scope of the invention.

こうした第2の実施形態によれば、音声SNSでの投稿音声に対して手間無く効率的に音楽を選択し、ひいては音声SNSでのユーザビリティ向上を図ることが可能となる。   According to such 2nd Embodiment, it becomes possible to select music efficiently with respect to the contribution sound | voice by audio | voice SNS, and, by extension, the usability improvement by audio | voice SNS can be aimed at.

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、上述の第2の実施形態の音楽選択支援システムにおいて、前記記憶部は、ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルを備え、前記評価テーブルにおいて、音楽データの識別情報に対し、該当音楽データに関して予め選定されたユーザ属性を更に対応付けて格納するものであり、前記演算部は、前記テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が所定値以上である選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記評価テーブルの各ユーザ属性に照合して、前記ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を更に実行するものである、としてもよい。   At least the following will be clarified by the description of the present specification. That is, in the music selection support system of the second embodiment described above, the storage unit includes a user table in which attribute information of each user of the social network service is described. The user attribute selected in advance with respect to the corresponding music data is further stored in association with each other, and the calculation unit collates the text data with each selected keyword group of the evaluation table, and includes the keyword included in the text data. When a plurality of selected keyword groups having a matching degree equal to or greater than a predetermined value are specified, attribute information about the user of the user terminal is read from the user table, and the attribute information of the user is collated with each user attribute of the evaluation table. The user attribute having the highest degree of matching with the user attribute information. Constant, and the identification information of the music data corresponding to the user attribute identified, said as post recommendation information of the music to be reproduced together with the audio data is to further execute a process of transmitting to the user terminal may be.

また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記マッチ度が最も高い選定キーワード群を複数特定した場合に、該当投稿音声データに、ソーシャルネットワークサービスにおける公開先の指定情報が付与されているか判定する処理と、前記判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていると判定した場合、該当指定情報が示す投稿公開先のユーザに関して、ユーザテーブルから属性情報を読み出し、当該属性情報を前記評価テーブルの各ユーザ属性に照合して、前記投稿公開先のユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理と、前記判定の結果、該当投稿音声データに投稿公開先の指定情報が付与されていないと判定した場合、該当投稿音声データの投稿ユーザに関して、ユーザテーブルから属性情報を読み出し、当該属性情報を前記評価テーブルの各ユーザ属性に照合して、前記投稿ユーザの属性情報とのマッチ度が最も高いユーザ属性を特定し、特定したユーザ属性に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を実行するものである、としてもよい。   In the music selection support system according to the second embodiment described above, when the calculation unit specifies a plurality of selected keyword groups having the highest degree of match, the calculation unit may include the posting destination of the social network service in the corresponding posted voice data. When it is determined that the designation information of the posting publishing destination is given to the corresponding posted audio data as a result of the determination of whether the designation information is given and the result of the judgment, regarding the user of the posting publishing destination indicated by the corresponding designation information, Attribute information is read from the user table, the attribute information is compared with each user attribute of the evaluation table, the user attribute having the highest degree of matching with the attribute information of the user of the posting disclosure destination is specified, and the specified user attribute The user terminal as the recommended information of music to be reproduced together with the posted audio data, with the identification information of the music data corresponding to When it is determined that the post publishing destination designation information is not given to the corresponding posted audio data as a result of the transmission and the determination, the attribute information is read from the user table for the posting user of the corresponding posted audio data, and the attribute Information is collated with each user attribute of the evaluation table, the user attribute having the highest degree of matching with the attribute information of the posting user is specified, and the identification information of the music data corresponding to the specified user attribute is A process of transmitting music to the user terminal as recommended information for music to be played back together with the data may be executed.

また、上述の第2の実施形態の音楽選択支援システムにおいて、前記記憶部は、各ユーザ端末から受信した投稿音声データを蓄積しているものであり、前記演算部は、前記テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記評価テーブルの各選定キーワード群に照合して、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信する処理を実行するものである、としてもよい。   In the music selection support system according to the second embodiment described above, the storage unit stores post voice data received from each user terminal, and the calculation unit evaluates the text data as the evaluation. When the selected keyword group having the highest degree of matching with the keyword included in the text data is identified in comparison with each selected keyword group in the table, the latest posted voice data related to the user of the user terminal is read from the storage unit, For the corresponding posted voice data, voice recognition processing is executed to generate text data, and the text data is collated with each selected keyword group in the evaluation table, and the degree of matching with the keyword included in the text data is the highest. The selected keyword group is specified, and the music data identification information corresponding to the specified selected keyword group is And it executes a process of transmitting to the user terminal as the recommended information of the music to be reproduced together with draft speech data may be.

また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記テキストデータが含むキーワードとのマッチ度が最も高い選定キーワード群を複数特定した場合、前記ユーザ端末のユーザに関する直近から所定範囲の期間の各投稿音声データを記憶部より読み出し、各投稿音声データに対し音声認識処理を実行してテキストデータを生成し、各テキストデータを跨って出現頻度が一定以上のキーワードを抽出し、当該キーワードを前記評価テーブルの各選定キーワード群に照合して、前記出現頻度一定以上のキーワードとのマッチ度が最も高い選定キーワード群を特定し、特定した選定キーワード群に対応する音楽データの識別情報を、前記投稿音声データと合わせて再生する音楽の推奨情報として前記ユーザ端末に送信するものである、としてもよい。   In the music selection support system according to the second embodiment described above, when the calculation unit specifies a plurality of selected keyword groups having the highest degree of matching with the keyword included in the text data, the calculation unit most recently relates to the user of the user terminal. From the storage unit, each posted voice data for a predetermined period is read from the storage unit, and voice recognition processing is performed on each posted voice data to generate text data, and keywords with a certain appearance frequency are extracted across each text data. The keyword is compared with each selected keyword group in the evaluation table, the selected keyword group having the highest degree of matching with the keyword having a certain appearance frequency or more is identified, and the music data corresponding to the identified selected keyword group The identification information is transmitted to the user terminal as recommended information for music to be played along with the posted audio data. It is shall, may be.

また、上述の第2の実施形態の音楽選択支援システムにおいて、前記演算部は、前記特定した選定キーワード群に対応する音楽データを、前記投稿音声データと合わせて再生し、当該再生したデータを前記ユーザ端末に送信する処理を実行するものであるとしてもよい。   In the music selection support system of the second embodiment described above, the calculation unit reproduces music data corresponding to the specified selected keyword group together with the posted voice data, and the reproduced data is It is good also as what performs the process transmitted to a user terminal.

−−−第3の実施形態におけるシステム構成−−−
以下に本発明の第3の実施形態について図面を用いて詳細に説明する。第3の実施形態の投稿音声再生制御システム1002を含むネットワーク構成は第1および第2の実施形態のネットワーク構成(図1)ものと同じである。そのため、以降は第1の実施形態と異なる構成についてのみ説明を行うこととする。第3の実施形態における投稿音声再生制御システム1002(以下、システム1002)は、音声SNSにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達を可能とするコンピュータシステムである。
--- System configuration in the third embodiment ---
Hereinafter, a third embodiment of the present invention will be described in detail with reference to the drawings. The network configuration including the posted audio reproduction control system 1002 of the third embodiment is the same as the network configuration (FIG. 1) of the first and second embodiments. Therefore, only the configuration different from that of the first embodiment will be described below. A posted audio reproduction control system 1002 (hereinafter, system 1002) in the third embodiment efficiently selects and reproduces similar posted audio in the audio SNS without trouble, and enables a good transmission of the poster intention. System.

続いてシステム1002のハードウェア構成について説明する。第3の実施形態におけるシステム1002は、第1の実施形態と同様、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されている。まずは、システム1002における処理の実行主体たるSNSサーバ150について説明を行うこととする。   Next, the hardware configuration of the system 1002 will be described. A system 1002 according to the third embodiment includes an SNS server 150, a public Web server 160, and a posting recording device 170, as in the first embodiment. First, the SNS server 150 that is the execution subject of processing in the system 1002 will be described.

この場合、システム1002を構成するSNSサーバ150は、図17に例示するように、ハードディスクドライブなど適宜な不揮発性記憶装置で構成される記憶部101、RAMなど揮発性記憶装置で構成されるメモリ103、前記記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算部104、LAN回線121等と接続し他装置との通信処理を担う通信部105、を備える。なお、記憶部101内には、第3の実施形態の投稿音声再生制御システムとして必要な機能を実装する為のプログラム102、イベントの識別情報と該当イベントに関して予め選定された選定キーワードとを対応付けた判定テーブル130が少なくとも記憶されている。   In this case, as illustrated in FIG. 17, the SNS server 150 configuring the system 1002 includes a storage unit 101 including an appropriate non-volatile storage device such as a hard disk drive, and a memory 103 including a volatile storage device such as a RAM. The computer 102, which reads and executes the program 102 held in the storage unit 101, executes the overall control of the apparatus itself and performs various determinations, computations, and control processes, and the LAN unit 121, etc. A communication unit 105 connected and responsible for communication processing with other devices. In the storage unit 101, the program 102 for implementing the functions necessary as the posted audio reproduction control system of the third embodiment, the event identification information, and the selection keyword selected in advance for the event are associated with each other. The determination table 130 is stored at least.

続いて、第3の実施形態のシステム1002が備える機能について説明する。第3の実施形態におけるシステム1002は、上述のように、SNSサーバ150、公開Webサーバ160、および投稿記録装置170にて構成されているが、以下では説明の簡明化の為、SNSサーバ150が公開Webサーバ160および投稿記録装置170の機能を備え、一体のシステム1002として機能を果たすものとして説明を行うこととする。なお、こうしたシステム1002において、ユーザ端末200とのデータ授受は公開Webサーバ160を介して実行され、投稿音声データの管理については投稿記録装置170を介して実行される。   Subsequently, functions provided in the system 1002 of the third embodiment will be described. As described above, the system 1002 according to the third embodiment includes the SNS server 150, the public Web server 160, and the posting recording device 170. However, for the sake of simplification of explanation, the SNS server 150 is described below. The description will be made on the assumption that the functions of the public Web server 160 and the post recording device 170 are provided and the functions as the integrated system 1002 are achieved. In such a system 1002, data exchange with the user terminal 200 is executed via the public Web server 160, and post audio data management is executed via the post recording device 170.

この場合、システム1002は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定し、当該特定した投稿音声データそれぞれに対し音声認識処理を実行してテキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する機能を有している。   In this case, the system 1002 receives, via the communication unit 105, the post audio data received from the user terminal 200 and stored in the post recording device 170, to which the same post release destination designation information is assigned. The posting recording device 170 is accessed and specified, voice recognition processing is performed on each of the specified posted voice data to generate text data, and the generated text data is stored in the storage unit 101 for each posting publication destination. It has a function.

また、システム1002は、上述で得た投稿公開先が共通な各テキストデータを判定テーブル130の各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、同時再生対象のグループとして記憶部に格納する機能を有している。   Further, the system 1002 collates each text data having the same posting publication destination obtained above with each selection keyword of the determination table 130, and the text data including the common selection keyword is converted into the same posting publication destination and the same event. As a group to be simultaneously reproduced, and stored in the storage unit.

また、システム1002は、上述の同時再生対象のグループに含まれる投稿音声データにおける、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索し、データ先頭から開始時点までの不要区間、ないし終了時点からデータ末尾までの不要区間の音声信号を削除し、当該削除実行後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信する機能を有している。   Further, the system 1002 searches for the start time or the end time of the audio signal having the predetermined attribute (selected keyword) in the posted audio data included in the group to be simultaneously reproduced, and an unnecessary section from the beginning of the data to the start time, In addition, it has a function of deleting an audio signal in an unnecessary section from the end point to the end of the data, and transmitting data obtained by simultaneously reproducing each posted audio data after execution of the deletion to the user terminal 200.

また、システム1002は、上述の削除実行後の各投稿音声データを、データ先頭から同時に再生したデータをユーザ端末200に送信するとしてもよい。或いは、システム1002は、削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータをユーザ端末200に送信するとしてもよい。   In addition, the system 1002 may transmit, to the user terminal 200, data obtained by simultaneously reproducing each posted audio data after the above-described deletion execution from the top of the data. Alternatively, the system 1002 may transmit, to the user terminal 200, data that has been reproduced with the end of the data aligned so that the post-deletion post-deletion data ends at the same time.

また、システム1002は、上述の削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速で再生し、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速で再生して、各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、ユーザ端末200に送信するとしてもよい。   Further, the system 1002 calculates the average value of the reproduction time lengths between the respective posted audio data after execution of the deletion described above, and among the posted audio data, those whose reproduction time length is less than the average value are slower than the reference speed. If the playback time length exceeds the average value of each posted audio data, playback is performed at a speed higher than the reference speed, and a process for unifying the playback time length of each posted audio data is executed. Data obtained by simultaneously reproducing the posted audio data may be transmitted to the user terminal 200.

−−−第3の実施形態におけるデータ構造例−−−
次に、第3の実施形態のシステム1002が用いるテーブルにおけるデータ構造例について説明する。図18は、第3の実施形態における判定テーブル130の一例を示す図である。判定テーブル130は、「結婚」、「誕生日」、「合格」といった各種イベントの識別情報をキーに、該当イベントに関して予め選定された、「けっこんおめでとう」、「たんじょうびおめでとう」、「ハッピーウェデング」といった選定キーワードを対応付けたレコードの集合体となっている。
--- Example of data structure in the third embodiment ---
Next, an example of a data structure in a table used by the system 1002 of the third embodiment will be described. FIG. 18 is a diagram illustrating an example of the determination table 130 according to the third embodiment. The determination table 130 includes “congratulations congratulations”, “congratulations congratulations”, “happy wedding”, which are pre-selected for the corresponding event using identification information of various events such as “marriage”, “birthday”, and “pass” as keys. It is an aggregate of records in which the selected keywords are associated with each other.

−−−第3の実施形態における処理手順例−−−
以下、第3の実施形態における投稿音声再生制御方法の実際手順について図に基づき説明する。以下で説明する投稿音声再生制御方法に対応する各種動作は、システム1002を構成する各装置らがメモリに読み出してそれぞれ実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
--- Example of processing procedure in the third embodiment ---
The actual procedure of the posted audio reproduction control method in the third embodiment will be described below with reference to the drawings. Various operations corresponding to the posted audio reproduction control method described below are realized by programs that are read into the memory and executed by each device constituting the system 1002. And this program is comprised from the code | cord | chord for performing the various operation | movement demonstrated below.

図19は、第3の実施形態における投稿音声再生制御方法の処理手順例を示すフロー図である。ここで、SNSサーバ150は、ユーザ端末200から受信し投稿記録装置170にて格納されている投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを、通信部105を介して投稿記録装置170にアクセスして特定する(s300)。   FIG. 19 is a flowchart showing a processing procedure example of the posted audio reproduction control method according to the third embodiment. Here, the SNS server 150 receives, through the communication unit 105, the post audio data received from the user terminal 200 and stored in the post recording device 170, to which the same post release destination designation information is assigned. The post recording device 170 is accessed and specified (s300).

次に、SNSサーバ150は、上述で特定した投稿音声データそれぞれに対し、プログラム102が含む音声認識プログラムを呼び出して実行して音声認識処理を実行し(s301)、テキストデータを生成し、当該生成したテキストデータを投稿公開先毎に記憶部101に格納する(s302)。   Next, the SNS server 150 calls and executes the speech recognition program included in the program 102 for each of the posted speech data specified above, executes speech recognition processing (s301), generates text data, and generates The stored text data is stored in the storage unit 101 for each posting publication destination (s302).

ここでSNSサーバ150は、前記の音声認識処理で生成したテキストデータを、判定テーブル130における各選定キーワードに照合し、共通する選定キーワードを含んでいたテキストデータを、同じ投稿公開先および同じイベントに関するものとして特定し、合成再生対象グループとして記憶部101に記憶する(s303)。SNSサーバ150は、このステップs303の処理を、上述のステップs302で得ている各投稿音声データについて全て実行する(s304)。こうした処理により、例えば、あるユーザ「U00001」を公開先とし、「けっこんおめでとう」という選定キーワードを共通に含んでいた投稿音声データが特定されたとする。図18に示す判定テーブル130の例であれば、この場合の投稿音声データのテーマは、イベント「結婚祝い」となる。また、図25に第3の実施形態における処理結果例を示す。この例では、「投稿1」、「投稿4」、「投稿7」、が、投稿公開先「太郎」、およびイベント「誕生祝い」について共通する投稿音声データとして特定されている。   Here, the SNS server 150 collates the text data generated by the voice recognition processing with each selection keyword in the determination table 130, and the text data including the common selection keyword is related to the same posting publication destination and the same event. It identifies as a thing and memorize | stores in the memory | storage part 101 as a synthetic | combination reproduction | regeneration object group (s303). The SNS server 150 executes the processing in step s303 for all the posted audio data obtained in step s302 (s304). By such processing, for example, it is assumed that posted audio data that has a certain user “U00001” as a disclosure destination and includes a selection keyword “congratulations” in common is specified. In the example of the determination table 130 shown in FIG. 18, the theme of the posted audio data in this case is the event “Marriage Celebration”. FIG. 25 shows an example of processing results in the third embodiment. In this example, “Post 1”, “Post 4”, and “Post 7” are specified as post voice data common to the post release destination “Taro” and the event “Birthday celebration”.

続いてSNSサーバ150は、上述のステップs303にて特定した、投稿公開先およびイベントが共通する各投稿音声データにおいて、所定属性(選定キーワード)の音声信号の開始時点ないし終了時点を検索する(s305)。上述の例であれば、SNSサーバ150は、前記各投稿音声データについて、「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定する。この音声解析処理は、SNSサーバ150が備えるプログラム102が備える音声解析プログラムを実行することで実行される。なお、音声解析プログラムは既存のものを利用すればよい。   Subsequently, the SNS server 150 searches for the start time point or the end time point of the audio signal having the predetermined attribute (selected keyword) in each post voice data specified in step s303 described above and having a common post release destination and event (s305). ). In the above example, the SNS server 150 specifies the utterance start time or the utterance end time of the selected keyword “Congratulations” for each post voice data by the voice analysis processing. This voice analysis process is executed by executing a voice analysis program provided in the program 102 provided in the SNS server 150. An existing voice analysis program may be used.

「けっこんおめでとう」の選定キーワードの発話開始時点、或いは発話終了時点を、音声解析処理により特定したSNSサーバ150は、図20に例示する如く、該当投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、ないし上述の発話終了時点から投稿音声データにおけるデータ末尾までの不要区間Δt2、のいずれかの音声信号を削除する(s306)。SNSサーバ150は、このステップs306の処理を、上述のステップs305で開始時点ないし終了時点を検索した各投稿音声データについて全て実行する(s307)。   The SNS server 150 that has identified the utterance start time or utterance end time of the selected keyword “Kekkon Congratulations” by the voice analysis process, from the top of the data in the corresponding posted voice data to the above utterance start time, as illustrated in FIG. Of the unnecessary section Δt1 or the unnecessary section Δt2 from the end time of the utterance to the end of the data in the posted voice data is deleted (s306). The SNS server 150 executes the process of step s306 for all the posted audio data searched for the start time or end time in step s305 (s307).

次に、SNSサーバ150は、上述のステップs306での不要区間削除の実行後、各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとし(s308)、当該ファイルを再生した再生データをユーザ端末200に送信する(s309)。このように、各投稿音声データをデータ先頭から重畳させることで合成して1ファイルとし、当該ファイルを再生することで、各投稿音声データの同時再生がなされることになる。図21に第3の実施形態の合成再生用ファイルの例1を示す。この図21にて示すように、前記のステップs308で合成して得たファイル、すなわち合成再生用ファイルは、各投稿者の投稿音声データが「けっこんおめでとう」の部分を先頭に多重化されたものとなっている。   Next, after executing unnecessary section deletion in step s306 described above, the SNS server 150 synthesizes each posted audio data by superimposing them from the top of the data to form one file (s308), and reproduction by reproducing the file Data is transmitted to the user terminal 200 (s309). As described above, each posted audio data is superimposed from the top of the data to be combined into one file, and by playing the file, each posted audio data is reproduced simultaneously. FIG. 21 shows an example 1 of a synthetic reproduction file according to the third embodiment. As shown in FIG. 21, the file obtained by synthesizing in step s308, that is, the synthetic reproduction file is obtained by multiplexing the contribution audio data of each contributor beginning with the "Congratulations" section. It has become.

なお、SNSサーバ150は、不要区間削除の実行後、上述のステップs308において、各投稿音声データを、同時に再生終了となるようデータ末尾を揃えて重畳させることで合成して1ファイルとし、前記ステップs309において、当該ファイルを再生した再生データをユーザ端末200に送信するとしてもよい。図22に第3の実施形態の合成再生用ファイルの例2を示す。この場合の合成再生用ファイルは、図22にて示すように、各投稿者の投稿音声データが、「けっこんおめでとう」の部分を後端に揃えて多重化されたものとなっている。   In addition, after execution of unnecessary section deletion, the SNS server 150 synthesizes each posted audio data by superimposing the data at the end so that the reproduction ends at the same time in step s308 described above to form one file. In s309, the reproduction data obtained by reproducing the file may be transmitted to the user terminal 200. FIG. 22 shows a second example of the composite reproduction file of the third embodiment. In this case, as shown in FIG. 22, the synthesized reproduction file is obtained by multiplexing the contribution audio data of each contributor with the “congratulations” part aligned at the rear end.

上述した例では、投稿音声データのうち、不要区間として削除するのは、データ先頭から選定キーワードの発話開始時点まで、或いは選定キーワードの発話終了時点からデータ末尾まで、としたが、その他にも、図23に示すように、第3の選定キーワードの発話終了時点から、第3の選定キーワードの発話開始時点までの不要区間Δt3を想定するとしてもよい。この場合、SNSサーバ150は、例えば、処理対象の各投稿音声データにおけるデータ先頭から上述の発話開始時点までの不要区間Δt1、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt1,Δt3の削除実行後の各投稿音声データを、データ先頭から重畳させることで合成して1ファイルとする(図24)。或いは、SNSサーバ150は、例えば、処理対象の各投稿音声データにおける上述の発話終了時点からデータ末尾までの不要区間Δt2、および、上述の不要区間Δt3、の音声信号を削除して、不要区間Δt2,Δt3の削除実行後の各投稿音声データを、データ末尾が揃うよう重畳させることで合成して1ファイルとするとしてもよい。   In the above-described example, the post audio data is deleted as an unnecessary section from the beginning of the data to the start time of the utterance of the selected keyword or from the end time of the utterance of the selected keyword to the end of the data. As shown in FIG. 23, an unnecessary section Δt3 from the end time of the utterance of the third selected keyword to the start time of the utterance of the third selected keyword may be assumed. In this case, for example, the SNS server 150 deletes the audio signals of the unnecessary section Δt1 from the data head to the above-described utterance start time and the unnecessary section Δt3 in each posted audio data to be processed, Each posted audio data after execution of deletion of Δt1 and Δt3 is synthesized by superimposing from the top of the data to form one file (FIG. 24). Alternatively, for example, the SNS server 150 deletes the unnecessary section Δt2 from the end time of the utterance to the end of the data and the unnecessary section Δt3 in the post data to be processed, and deletes the unnecessary section Δt2. , Δt3 may be combined into a single file by superimposing the post audio data after execution of deletion of Δt3 so that the end of the data is aligned.

なお、上述のステップs306において、不要区間の削除を行って得られた投稿音声データの再生時間長が、各投稿音声データ間で大きく異なっているとすれば、上述の合成再生用ファイルを生成して再生したとしても、それを聞いているユーザは発話タイミングがばらばらにずれた内容のメッセージを聞くことになりかねない。   If the playback time length of the posted audio data obtained by deleting the unnecessary section in step s306 is greatly different between the posted audio data, the above-described synthetic playback file is generated. Even if it is played back, the user who listens to it may hear a message whose content is different from the timing of the utterance.

そこで、SNSサーバ150は、上述のステップs308において、不要区間削除実行後の各投稿音声データを重畳させる際、不要区間削除実行後の各投稿音声データ間での再生時間長の平均値を算定し(s308A)、各投稿音声データのうち再生時間長が平均値に満たないものは基準速度より低速の再生速度、各投稿音声データのうち再生時間長が平均値を越えるものは基準速度より高速の再生速度を設定し、各投稿音声データの再生時間長を統一する処理を実行する(s308B)。SNSサーバ150は、当該処理後の各投稿音声データを合成して1ファイルとする。   Therefore, the SNS server 150 calculates the average reproduction time length between the posted audio data after the unnecessary section deletion execution when the posted voice data after the unnecessary section deletion execution is superimposed in the above-described step s308. (S308A), each posted audio data whose playback time length is less than the average value is a playback speed slower than the reference speed, and each posted audio data whose playback time length exceeds the average value is faster than the reference speed. A process for setting the playback speed and unifying the playback time length of each posted audio data is executed (s308B). The SNS server 150 synthesizes each post audio data after the processing into one file.

こうした第3の実施形態によれば、音声SNSにおける類似した投稿音声を手間無く効率的に選択、再生し、投稿者意図の良好な伝達が可能となる。   According to the third embodiment, it is possible to efficiently select and reproduce similar posted voices in the voice SNS without trouble and to transmit the poster intentions in a good manner.

本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、データ先頭から同時に再生したデータを前記ユーザ端末に送信するものであるとしてもよい。   At least the following will be clarified by the description of the present specification. That is, in the posted sound reproduction control system according to the third embodiment, the calculation unit may transmit data obtained by simultaneously reproducing each posted sound data after execution of the deletion from the data head to the user terminal. Good.

また、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データを、同時に終了するようデータ末尾を揃えて再生したデータを前記ユーザ端末に送信するものであるとしてもよい。   Further, in the posted audio reproduction control system according to the third embodiment, the calculation unit transmits data reproduced by aligning the end of the data so that the post audio data after the execution of deletion is completed at the same time. It may be a thing.

また、第3の実施形態の投稿音声再生制御システムにおいて、前記演算部は、前記削除実行後の各投稿音声データ間での再生時間長の平均値を算定し、前記各投稿音声データのうち再生時間長が前記平均値に満たないものは基準速度より低速の再生速度を設定し、前記各投稿音声データのうち再生時間長が前記平均値を越えるものは基準速度より高速の再生速度を設定して、前記各投稿音声データの再生時間長を統一する処理を実行し、当該処理後の各投稿音声データを同時に再生したデータを、前記ユーザ端末に送信するものであるとしてもよい。   Further, in the posted audio reproduction control system according to the third embodiment, the calculation unit calculates an average value of reproduction time lengths between the respective post audio data after execution of the deletion, and reproduces the posted audio data. If the time length is less than the average value, a playback speed lower than the reference speed is set, and among the posted audio data, if the playback time length exceeds the average value, a playback speed higher than the reference speed is set. Then, a process for unifying the playback time length of each posted audio data may be executed, and data obtained by simultaneously reproducing each posted audio data after the processing may be transmitted to the user terminal.

1001 音楽選択支援システム(第2の実施形態)
1002 投稿音声再生制御システム(第3の実施形態)
1003 投稿音声再生制御システム(第1の実施形態)
11、101、111 記憶部
12、102、112 プログラム
13、103、113 メモリ
14、104、114 演算部
15、105、115 通信部
16 投稿音声データ
120 インターネット網(ネットワーク)
121 LAN回線(ネットワーク)
122 公衆回線網(ネットワーク)
125 評価テーブル
126 一次評価テーブル
127 二次評価テーブル
128 ユーザテーブル
129 投稿音声データ情報テーブル
130 判定テーブル
131 グルーピングテーブル
132 優先度評価テーブル
133 ユーザテーブル
150 SNSサーバ
160 公開Webサーバ
170 投稿記録装置
200 ユーザ端末
220、230 投稿者端末(ユーザ端末)
240 閲覧再生者端末(ユーザ端末)
300 電話応答システム
310 交換機
320 自動音声応答装置
330 CTI装置
1001 Music selection support system (second embodiment)
1002 Posted Voice Playback Control System (Third Embodiment)
1003 Posted audio playback control system (first embodiment)
11, 101, 111 Storage unit 12, 102, 112 Program 13, 103, 113 Memory 14, 104, 114 Calculation unit 15, 105, 115 Communication unit 16 Posted audio data 120 Internet network (network)
121 LAN line (network)
122 Public network (network)
125 Evaluation table 126 Primary evaluation table 127 Secondary evaluation table 128 User table 129 Posted audio data information table 130 Determination table 131 Grouping table 132 Priority evaluation table 133 User table 150 SNS server 160 Public Web server 170 Post recording device 200 User terminal 220 , 230 Contributor terminal (user terminal)
240 Browsing player terminal (user terminal)
300 Telephone response system 310 Exchange 320 Automatic voice response device 330 CTI device

Claims (5)

ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、
音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部と、
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理とを実行する演算部と、
を備えることを特徴とする投稿音声再生制御システム。
A communication unit that communicates with a user terminal used by a user of a social network service via a network;
A storage unit that stores identification information of music data and a theme of the corresponding music, and further stores a grouping table in which a keyword of the posted audio data and the corresponding theme are associated;
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A calculation unit that sequentially reproduces each posted audio data included in the group to be continuously reproduced and transmits the reproduced data to the user terminal;
A posted voice reproduction control system comprising:
前記記憶部は、
ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの属性情報と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、
前記演算部は、
前記連続再生対象のグループにおける投稿公開先のユーザに関する属性情報を前記ユーザテーブルより読み出し、前記ユーザの属性情報を前記優先度評価テーブルに照合して、前記ユーザの属性情報に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、
ことを特徴とする請求項1に記載の投稿音声再生制御システム。
The storage unit
A user table describing attribute information of each user of the social network service, and a priority evaluation table in which the attribute information of the user is associated with the playback priority level for continuous playback,
The computing unit is
Read the attribute information related to the user of the posting release destination in the group to be continuously reproduced from the user table, check the attribute information of the user against the priority evaluation table, and reproduce the group according to the attribute information of the user A priority level is specified, a playback order between groups is determined according to the level of the playback priority level, the group to be continuously played back is read from the storage unit in the playback order, and each posted audio data included in the group is read Sequentially reproducing and transmitting the reproduced data to the user terminal,
The posted voice reproduction control system according to claim 1.
前記記憶部は、
各ユーザ端末から受信した投稿音声データを蓄積しているものであり、
ソーシャルネットワークサービスの各ユーザの属性情報を記述したユーザテーブルと、ユーザの投稿内容と連続再生対象の再生優先レベルとを対応付けた優先度評価テーブルとを更に備え、
前記演算部は、
前記連続再生対象のグループにおける投稿公開先のユーザに関する直近の投稿音声データを記憶部より読み出し、該当投稿音声データに対し、音声認識処理を実行してテキストデータを生成し、当該テキストデータを前記優先度評価テーブルに照合して、前記ユーザの投稿内容に応じた前記グループの再生優先レベルを特定し、当該再生優先レベルの高低に応じてグループ間の再生順序を決定し、当該再生順序で前記連続再生対象のグループを記憶部より読み出し、当該グループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信するものである、
ことを特徴とする請求項1に記載の投稿音声再生制御システム。
The storage unit
It accumulates posted audio data received from each user terminal,
A user table that describes attribute information of each user of the social network service, and a priority evaluation table that associates the user's post content with the playback priority level for continuous playback,
The computing unit is
Reads the latest posted voice data related to the user of the posting release destination in the group to be continuously played from the storage unit, executes voice recognition processing on the corresponding posted voice data, generates text data, and the text data is the priority The playback priority level of the group according to the user's posted content is identified, the playback order between the groups is determined according to the level of the playback priority level, and the continuous playback order is determined according to the playback order. A group to be reproduced is read from the storage unit, each posted audio data included in the group is sequentially reproduced, and the reproduced data is transmitted to the user terminal.
The posted voice reproduction control system according to claim 1.
ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータが、
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、
を実行することを特徴とする投稿音声再生制御方法。
A grouping in which a communication unit that communicates via a network with a user terminal used by a user of a social network service, music data identification information and the corresponding music theme are associated, and a keyword of the posted audio data is associated with the corresponding theme A computer having a storage unit for storing a table;
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A process of sequentially reproducing each posted audio data included in the group to be continuously reproduced, and transmitting the reproduced data to the user terminal;
A method for controlling the reproduction of posted audio, comprising:
ソーシャルネットワークサービスのユーザが利用するユーザ端末とネットワークを介して通信する通信部と、音楽データの識別情報と該当音楽のテーマとを対応付け、更に投稿音声データのキーワードと該当テーマを対応付けたグルーピングテーブルを格納する記憶部とを備えたコンピュータに、
前記通信部を介しユーザ端末から受信した投稿音声データのうち、同じ投稿公開先の指定情報が付与されているものを特定し、当該特定した各投稿音声データに付与されている、該当投稿音声データと同時再生すべき音楽の識別情報を前記グルーピングテーブルに照合して、各投稿音声データと同時再生すべき音楽のテーマを特定し、当該特定したテーマが互いに共通する投稿音声データらを連続再生対象のグループとして記憶部に格納する処理と、
前記連続再生対象のグループに含まれる各投稿音声データを順次再生し、当該再生したデータを前記ユーザ端末に送信する処理と、
を実行させることを特徴とする投稿音声再生制御プログラム。
A grouping in which a communication unit that communicates via a network with a user terminal used by a user of a social network service, music data identification information and the corresponding music theme are associated, and a keyword of the posted audio data is associated with the corresponding theme In a computer having a storage unit for storing a table,
Among the posted audio data received from the user terminal via the communication unit, the specified posted audio data that is assigned to the specified posted audio data is identified. The identification information of the music to be played back simultaneously is collated with the grouping table, the music theme to be played back simultaneously with each posted voice data is specified, and the posted voice data having the specified theme in common with each other is subject to continuous playback Storing in the storage unit as a group of
A process of sequentially reproducing each posted audio data included in the group to be continuously reproduced, and transmitting the reproduced data to the user terminal;
A post voice reproduction control program characterized by causing
JP2012168739A 2012-07-30 2012-07-30 Posted audio playback control system, posted audio playback control method, posted audio playback control program Active JP5814878B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012168739A JP5814878B2 (en) 2012-07-30 2012-07-30 Posted audio playback control system, posted audio playback control method, posted audio playback control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012168739A JP5814878B2 (en) 2012-07-30 2012-07-30 Posted audio playback control system, posted audio playback control method, posted audio playback control program

Publications (2)

Publication Number Publication Date
JP2014027614A true JP2014027614A (en) 2014-02-06
JP5814878B2 JP5814878B2 (en) 2015-11-17

Family

ID=50200843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012168739A Active JP5814878B2 (en) 2012-07-30 2012-07-30 Posted audio playback control system, posted audio playback control method, posted audio playback control program

Country Status (1)

Country Link
JP (1) JP5814878B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021049048A1 (en) * 2019-09-11 2021-03-18

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021049048A1 (en) * 2019-09-11 2021-03-18
WO2021049048A1 (en) * 2019-09-11 2021-03-18 拓也 木全 Video-image providing system and program
JP7153143B2 (en) 2019-09-11 2022-10-13 拓也 木全 Video providing system and program

Also Published As

Publication number Publication date
JP5814878B2 (en) 2015-11-17

Similar Documents

Publication Publication Date Title
JP4033944B2 (en) Online karaoke system characterized by recommended music selection function according to music to be played
US20150082171A1 (en) System and Method for Recording and Sharing Music
Steffen From Edison to Marconi: the first thirty years of recorded music
Benford et al. Supporting traditional music-making: designing for situated discretion
CN101652808A (en) Modifying audiovisual output in a karaoke system based on performance context
JP5814879B2 (en) Posted audio playback control system, posted audio playback control method, posted audio playback control program
TWI807428B (en) Method, system, and computer readable record medium to manage together text conversion record and memo for audio file
Craft Headfirst into an Abyss: the Politics and Political reception of Hamilton
JP5779938B2 (en) Playlist creation device, playlist creation method, and playlist creation program
JP5937988B2 (en) Video information distribution system
JP2011095437A (en) Karaoke scoring system
JP5814878B2 (en) Posted audio playback control system, posted audio playback control method, posted audio playback control program
Wright Jaco Pastorius, the electric bass, and the struggle for jazz credibility
JP5457791B2 (en) Karaoke scoring system
JP2014026603A (en) Music selection support system, music selection support method, and music selection support program
JP2009180952A (en) Karaoke system with electronic index book function
KR100888341B1 (en) System and Method for Searching a Sound Source, Server for Searching a Sound Source Therefor
JP6027205B2 (en) Portable information communication terminal and program
JP2007121550A (en) Karaoke contest system capable of reproducing and hearing singing voice of high order prizewinner, karaoke system, and contest server
JP6317655B2 (en) Karaoke system and server
Armstrong Hot collecting off the record: ralph J. Gleason’s start in music journalism
US20110077756A1 (en) Method for identifying and playing back an audio recording
JP4331230B2 (en) Online karaoke system, host device
Frisch Reger’s historicist modernism
Van Puymbroeck Between Genre and Medium: Hilda Tablet, Henry Reed's Fictional Metabiography for Radio

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141017

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150918

R150 Certificate of patent or registration of utility model

Ref document number: 5814878

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150