WO2023158384A2 - 信息处理方法、装置、设备、存储介质及程序 - Google Patents

信息处理方法、装置、设备、存储介质及程序 Download PDF

Info

Publication number
WO2023158384A2
WO2023158384A2 PCT/SG2023/050098 SG2023050098W WO2023158384A2 WO 2023158384 A2 WO2023158384 A2 WO 2023158384A2 SG 2023050098 W SG2023050098 W SG 2023050098W WO 2023158384 A2 WO2023158384 A2 WO 2023158384A2
Authority
WO
WIPO (PCT)
Prior art keywords
multimedia
identifier
target
identifiers
information set
Prior art date
Application number
PCT/SG2023/050098
Other languages
English (en)
French (fr)
Other versions
WO2023158384A3 (zh
Inventor
邓乐来
戴俊宇
宋旭晨
刘石竹
冯元戬
薛愉凡
林晓慧
高策
Original Assignee
脸萌有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 脸萌有限公司 filed Critical 脸萌有限公司
Publication of WO2023158384A2 publication Critical patent/WO2023158384A2/zh
Publication of WO2023158384A3 publication Critical patent/WO2023158384A3/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the music platform can combine songs in the database in a diversified manner, form multiple songs into a playlist, and push it to users in the form of a playlist.
  • users can also create multiple songs as a playlist according to their preferences.
  • After the music is managed in the form of playlists it is necessary to determine the name of each playlist.
  • it is necessary to manually determine the name of the song list so that, on the one hand, it takes a lot of manpower and time costs, and on the other hand, the quality of the name of the song list cannot be guaranteed.
  • SUMMARY Embodiments of the present disclosure provide an information processing method, device, equipment, storage medium, and program.
  • an embodiment of the present disclosure provides an information processing method, including: acquiring a first multimedia information set to be processed, where the first multimedia information set includes a plurality of first multimedia information; acquiring Reference information, the reference information includes multiple reference multimedia identifiers, one reference multimedia identifier is used to indicate a reference multimedia information set, and one reference multimedia information set includes multiple reference multimedia information; according to the first multimedia information Set, at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers, and the multimedia feature corresponding to the reference multimedia information set indicated by the candidate multimedia identifier is corresponding to the first multimedia information set The matching degree between the multimedia features satisfies a preset condition; and determining a target multimedia identifier corresponding to the first multimedia information set according to the at least one candidate multimedia identifier.
  • an embodiment of the present disclosure provides an information processing device, including: a first acquiring module, configured to acquire a first multimedia information set to be processed, where the first multimedia information set includes a plurality of first multimedia information; a second acquiring module, configured to acquire reference information, The reference information includes multiple reference multimedia identifiers, one reference multimedia identifier is used to indicate a reference multimedia information set, and one reference multimedia information set includes multiple reference multimedia information; the first determining module is configured to, according to the first The multimedia information set, at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers, and the multimedia feature corresponding to the reference multimedia information set indicated by the candidate multimedia identifier is the same as that of the first multimedia identifier.
  • an embodiment of the present disclosure provides an electronic device, including: a processor and a memory; the memory stores computer-executable instructions; the processor executes the computer-executable instructions to implement the first aspect and the first aspect.
  • an embodiment of the present disclosure provides a computer-readable storage medium, where computer-executable instructions are stored in the computer-readable storage medium, and when the processor executes the computer-executable instructions, the above first aspect and the first An information processing method in various possible implementations of the aspect.
  • the embodiments of the present disclosure provide a computer program product, including a computer program, and when the computer program is executed by a processor, implement the information processing method in the first aspect and in various possible implementation manners of the first aspect.
  • the embodiments of the present disclosure provide a computer program, which implements the information processing method in the first aspect and various possible implementation manners of the first aspect when the computer program is executed by a processor.
  • the method includes: acquiring a first multimedia information set to be processed, the first multimedia information set includes a plurality of first multimedia information body information; acquiring reference information, where the reference information includes a plurality of reference multimedia identifiers; according to the first multimedia information set, at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers, and the to-be-selected multimedia identifier is determined.
  • the matching degree between the multimedia features corresponding to the reference multimedia information set indicated by the selected multimedia identifier and the multimedia features corresponding to the first multimedia information set satisfies a preset condition; according to the at least one candidate multimedia identifier, determine the The target multimedia identifier corresponding to the first multimedia information set.
  • FIG. 1 is a schematic diagram of an application scenario provided by an embodiment of the present disclosure
  • FIG. 2 is a schematic flowchart of an information processing method provided by an embodiment of the present disclosure
  • Fig. 3 is a schematic flowchart of another information processing method provided by an embodiment of the present disclosure
  • Fig. 4 is a schematic diagram of a determination process of a candidate multimedia identifier provided by an embodiment of the present disclosure
  • Fig. 5 is another schematic diagram provided by an embodiment of the present disclosure
  • FIG. 6 is a schematic diagram of a target song list name determination process provided by an embodiment of the present disclosure
  • FIG. 7 is a schematic diagram of an information processing process provided by an embodiment of the present disclosure
  • FIG. 8 is a schematic diagram of the present disclosure A schematic structural diagram of an information processing apparatus provided in an embodiment;
  • FIG. 9 is a schematic structural diagram of an electronic device provided in an embodiment of the present disclosure.
  • DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS In order to make the purpose, technical solutions and advantages of the embodiments of the present disclosure clearer, the technical solutions in the embodiments of the present disclosure will be clearly and completely described below in conjunction with the drawings in the embodiments of the present disclosure. Obviously, the described The embodiments are some of the embodiments of the present disclosure, but not all of them. Based on the embodiments in the present disclosure, all other embodiments obtained by persons of ordinary skill in the art without creative efforts fall within the protection scope of the present disclosure.
  • the present disclosure provides an information processing method, device, device, storage medium, and program, which can be applied to scenarios where it is necessary to determine a target multimedia name corresponding to a first multimedia information set.
  • the first multimedia information set includes a plurality of first multimedia information.
  • the target multimedia identifier corresponding to the first multimedia information set can be automatically determined according to multiple reference multimedia identifiers. In this way, on the one hand, manpower and time are saved, and on the other hand, the quality of the target multimedia identification is improved.
  • the multimedia information includes but not limited to: audio, text, image, video and so on.
  • the first multimedia information set may be a song list, or may also be a book list, or may also be a group of videos, or may also be a group of images.
  • the multimedia identifier corresponding to the first multimedia information set refers to information used to identify the first multimedia information set.
  • a multimedia identifier can also be called a multimedia name.
  • the embodiment of the present disclosure does not limit the form of the multimedia identification, which may be words, phrases, sentences, paragraphs, etc. for example.
  • the application scenario of the embodiment of the present disclosure will be described below by taking the first multimedia information set as an example of a song list.
  • the song list to be named includes: song 1, song 2, song 3, ..., song N.
  • the playlist to be named is input into the information processing device, and the information processing device can refer to the name of each reference playlist in the playlist database to determine the name of the target playlist corresponding to the playlist to be named.
  • the information processing apparatus may be a terminal device or a server, and may also be a device integrated into a terminal device or a server.
  • the terminal device may be any electronic device with multimedia interactive function, including but not limited to: smart phone, tablet computer, notebook computer, smart TV, smart wearable device, smart home device, smart vehicle-mounted device, smart speaker, etc.
  • the server may be a cloud server, also called a cloud computing server or a cloud host, which is a host product in the cloud computing service system.
  • the server can also be a server of a distributed system, or a server combined with a blockchain.
  • the technical solution of the present disclosure will be described in detail below with specific embodiments. The following specific embodiments may be combined with each other, and the same or similar concepts or processes may not be repeated in some embodiments.
  • Fig. 2 is a schematic flowchart of an information processing method provided by an embodiment of the present disclosure.
  • the execution subject of this embodiment may be an information processing device. As shown in Figure 2, the method of this embodiment includes:
  • the first multimedia information set includes a plurality of first multimedia information.
  • the first multimedia information is any one of the following: audio, text, image or video.
  • the first multimedia information set may include multiple songs, or multiple operas.
  • the first multimedia information is text
  • the first multimedia information set may include multiple texts, for example, multiple articles, multiple books, and the like.
  • the first multimedia information is an image
  • the first multimedia information set may include multiple images.
  • the first multimedia information is a video
  • the first multimedia information set may include multiple videos, for example, multiple TV dramas, or multiple movies, or multiple small videos, and the like.
  • the first multimedia information set is the multimedia information set to be named.
  • the target multimedia identifier is used to reflect the characteristics of each first multimedia information in the first multimedia information set.
  • the first multimedia information set can be called a song list.
  • a song list name can be generated for the play list, and the play list name is used to reflect the characteristics of the songs in the play list.
  • the reference information includes multiple reference multimedia identifiers
  • one reference multimedia identifier is used to indicate a reference multimedia information set
  • one reference multimedia information set includes multiple reference multimedia information.
  • the reference information refers to information that needs to be referred to during the process of automatically determining the target multimedia identifier corresponding to the first multimedia information set.
  • Multiple reference multimedia information sets in the reference information correspond to multimedia identifiers.
  • the reference information may be called a song list library, and the song list library includes names of reference playlists corresponding to a plurality of reference playlists.
  • Each reference playlist includes a plurality of reference songs.
  • S203 According to the first multimedia information set, determine at least one candidate multimedia identifier among the plurality of reference multimedia identifiers, and the multimedia feature corresponding to the reference multimedia information set indicated by the candidate multimedia identifier is the same as A matching degree between multimedia features corresponding to the first multimedia information set satisfies a preset condition.
  • feature extraction may be performed on the first multimedia information set to obtain multimedia features corresponding to the first multimedia information set.
  • feature extraction is performed on the reference multimedia information set indicated by the reference multimedia identifier, to obtain multimedia features corresponding to the reference multimedia information set indicated by the reference multimedia identifier.
  • a reference multimedia identifier whose matching degree satisfies a preset condition may be determined as a candidate multimedia identifier. For example, for each reference multimedia identifier, if the matching degree between the multimedia feature corresponding to the reference multimedia information set indicated by the reference multimedia identifier and the multimedia feature corresponding to the first multimedia information set is greater than or equal to a preset threshold, then The reference multimedia identifier is determined as a candidate multimedia identifier.
  • the first multimedia information set as an example of a song list
  • feature extraction may be performed on songs in the song list from multiple dimensions to obtain multimedia features corresponding to the first multimedia information set.
  • multiple dimensions include but are not limited to: genre, emotion, genre, etc.
  • the multimedia features corresponding to the first multimedia information set include features of one or more dimensions of genre, emotion, and genre.
  • feature extraction methods such as Mel-Frequency Cepstral Coefficients (MFCC) and Filter Banks (Fbanks) may be used to extract features of the songs in the song list to be named.
  • MFCC Mel-Frequency Cepstral Coefficients
  • Fbanks Filter Banks
  • S204 Determine a target multimedia identifier corresponding to the first multimedia information set according to the at least one candidate multimedia identifier.
  • the target multimedia identifier corresponding to the first multimedia information set it may be determined by referring to each candidate multimedia identifier.
  • a target multimedia identifier may be determined from the at least one candidate multimedia identifier.
  • the at least one candidate multimedia identifier may be processed to obtain multiple processed candidate multimedia identifiers, and a target multimedia identifier is determined among the multiple processed candidate multimedia identifiers.
  • the first multimedia information set is a song list as an example for illustration.
  • At least one song list name to be selected can be determined from a plurality of reference song list names stored in the song list library (ie reference information), and the song list characteristics of the reference song list indicated by the song list name to be selected are related to The matching degree between the features of the song list to be named satisfies the preset condition.
  • the name of the target playlist of the playlist to be named is determined. For example, use the name of a playlist to be selected as the name of the target playlist; or, modify the name of a playlist to be selected to obtain the name of the target playlist; or, reorganize and correct the names of multiple playlists to be selected , to get the name of the target playlist.
  • the information processing device clusters the songs in the song library to form multiple clusters. Multiple songs included in each cluster form a song list, thereby obtaining multiple song lists. Furthermore, the information processing device executes the method of this embodiment for each first playlist among the plurality of playlists, obtains the name of the playlist corresponding to the first playlist, and sets the name of the first playlist as the name of the playlist .
  • the information processing device may be a server. In another example scenario, the information processing device responds to an operation request input by the user for creating a playlist, and determines the first playlist to be created according to the operation request.
  • the method of this embodiment is executed for the first playlist to obtain the name of the playlist corresponding to the first playlist.
  • the information processing device sets the name of the first playlist as the name of the playlist, or displays the name of the playlist.
  • the information processing device may be a terminal device.
  • the terminal device determines the first playlist to be created in response to an operation request for creating a playlist input by the user, and generates a playlist naming request, where the playlist naming request includes the first playlist.
  • the information processing device receives the song list naming request sent by the terminal device.
  • the information processing device executes the method of this embodiment according to the first playlist, and obtains the name of the playlist corresponding to the first playlist.
  • the information processing device sends the song list name to the terminal device.
  • the terminal device displays the name of the playlist, or sets the name of the first playlist as the name of the playlist.
  • the information processing device may be a server. It should be noted that, this embodiment does not limit the execution order of S201 to S202. The execution order of the two can be interchanged, or the two can also be executed at the same time.
  • the information processing method provided in this embodiment includes: acquiring a first multimedia information set to be processed, where the first multimedia information set includes a plurality of first multimedia information; acquiring reference information, where the reference information includes multiple a reference multimedia identifier, and according to the first multimedia information set, at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers, and the reference multimedia information set indicated by the candidate multimedia identifier corresponds to The matching degree between the multimedia features and the multimedia features corresponding to the first multimedia information set satisfies a preset condition; according to the at least one candidate multimedia identifier, determine the target multimedia corresponding to the first multimedia information set logo.
  • Fig. 3 is a schematic flowchart of another information processing method provided by an embodiment of the present disclosure. As shown in FIG. 3, the method of this embodiment includes:
  • S301 Determine a first tag set according to multimedia features corresponding to the first multimedia information set, where the first tag set includes at least one feature tag.
  • the feature label refers to a category obtained by classifying multimedia features.
  • feature tags can be used to indicate categories of multimedia features.
  • multimedia features can be classified and processed from multiple dimensions to obtain multiple feature labels.
  • FIG. 4 is a schematic diagram of a process of determining a candidate multimedia identifier provided by an embodiment of the present disclosure.
  • the first song list feature (that is, the multimedia feature corresponding to the first multimedia information set) is the song list feature obtained by performing feature extraction on the named song list.
  • the characteristics of the first song list can be classified and processed from multiple dimensions such as genre, emotion, and genre to obtain the first set of tags.
  • the first label set includes feature labels corresponding to each dimension.
  • the feature tags corresponding to the genre dimension include but are not limited to: Chinese style, popular, classical, hip-hop, etc.
  • the feature labels corresponding to the emotional dimension include but are not limited to: neutral, happy, calm, depressed, sad, etc.
  • the feature tags corresponding to the genre dimension include but are not limited to: folk, disco, heavy metal, and rhythm and blues (R&B).
  • the feature label obtained by classifying the features of the first song list from the genre dimension is "Chinese style”
  • the feature label obtained by classifying the features of the first song list from the emotion dimension is "joy”
  • the feature label obtained by classifying the features of the first song list in the genre dimension is "folk songs”
  • the first label set is ⁇ Chinese style, joy, folk songs ⁇ .
  • S302 Determine, according to the multimedia feature corresponding to the reference multimedia information set indicated by each reference multimedia identifier, a reference tag set corresponding to the reference multimedia identifier, where the reference tag set includes at least one feature tag. Similar to the above S301, the multimedia features corresponding to the reference multimedia information set indicated by each reference multimedia identifier may be classified to obtain a reference tag set corresponding to the reference multimedia identifier. In this way, multiple reference tag sets can be obtained. Continuing to refer to Fig. 4, for each reference playlist in the playlist library, from multiple dimensions such as genre, emotion, and genre, the features of the reference playlist corresponding to the reference playlist are classified and processed to obtain a set of reference labels.
  • the reference label set 1 obtained by referring to the playlist 1 is ⁇ label xl, label yl, label z3 ⁇
  • the reference label set 2 obtained by referring to the playlist 2 is ⁇ label x2, label yl, label z2 ⁇
  • the reference playlist 3 The obtained reference label set 3 is ⁇ label x3, label y2, label zl ⁇
  • the reference label set 4 obtained by referring to the song list 4 is ⁇ label xl, label y3, label z3 ⁇
  • the reference label set 5 obtained by referring to the song list 5 is ⁇ label xl, label y3, label zl ⁇ .
  • At least one candidate multimedia identifier among the plurality of reference multimedia identifiers may be determined in the following manner:
  • multiple reference feature tags can be obtained by performing deduplication processing on the feature tags in the reference tag set corresponding to each reference multimedia identifier.
  • the feature tags in multiple reference tag sets are deduplicated, and the multiple reference feature tags obtained are: label xl, label x2, label x3, label yl, label y2, label y3 , label zl , label z2 , label z3 .
  • each reference multimedia identifier and the reference tag set corresponding to each reference multimedia identifier determine the reference multimedia identifier set corresponding to each reference feature tag.
  • the method of determining the reference multimedia identification set corresponding to each reference feature label is as follows: For each reference multimedia label, it is judged whether the reference feature label is included in the reference label set corresponding to the reference multimedia label, and if so, the The reference multimedia identifier is added to the reference multimedia identifier set corresponding to the reference feature tag.
  • the set of reference playlist names corresponding to each reference feature tag can be determined as follows: Label xl: ⁇ reference playlist name 1, reference playlist name 4, reference playlist name 5 ⁇ ; label x2: ⁇ reference song list name 2 ⁇ ; label x3: ⁇ reference song list name 3 ⁇ ; label yl: ⁇ reference song list name 1, reference song list name 2 ⁇ ; label y2: ⁇ reference song list name 3 ⁇ ; label y3: ⁇ reference song list name 4, reference song list name 5 ⁇ ; label zl: ⁇ reference song list name 3, reference song list name 5 ⁇ ; label z2: ⁇ reference song list name 2 ⁇ ; label z3: ⁇ reference song Single name 1, reference song list name 4 ⁇ ;
  • the set of reference playlist names corresponding to label xl is ⁇ reference playlist name 1, reference playlist name 4, reference playlist name 5 ⁇
  • the set of reference playlist names corresponding to label y3 is ⁇ reference playlist name 4, reference playlist name 5
  • the set of reference playlist names corresponding to label z3 is ⁇ reference playlist name 1, reference playlist name 4 ⁇ .
  • FIG. 5 is a schematic flowchart of another information processing method provided by an embodiment of the present disclosure. As shown in Figure 5, the method of this embodiment includes:
  • S501 Perform word segmentation processing on each multimedia identifier to be selected to obtain a plurality of words corresponding to the multimedia identifier to be selected.
  • a word segmentation algorithm can be used to perform word segmentation processing on each multimedia identifier to be selected, and multiple words corresponding to the multimedia identifier to be selected can be obtained.
  • the following uses the name of the song list as an example to illustrate the process of determining the target multimedia identifier according to the multimedia identifier to be selected in conjunction with FIG. 6 .
  • FIG. 6 is a schematic diagram of a process of determining a target song list name provided by an embodiment of the present disclosure.
  • each multimedia identifier to be selected undergoes word segmentation processing to obtain multiple words.
  • Multiple recombined multimedia identifiers can be obtained by reorganizing words among different multimedia identifiers to be selected.
  • multiple words obtained after word segmentation are combined to obtain multiple reorganized song list names.
  • S503 Perform correction processing on the multiple reassembled multimedia identifiers to obtain multiple revised multimedia identifiers. It should be understood that the reorganized multimedia identifier obtained after the above recombination may not meet the requirements for multimedia naming. Therefore, the reassembled multimedia identifier may be corrected so that the obtained corrected multimedia identifier meets the requirements for multimedia naming. In some possible implementation manners, at least one of the following processes may be performed on each reassembled multimedia identifier to obtain a modified multimedia identifier: Processing method 1: Delete the first preset word in the reassembled multimedia identifier.
  • the first preset word is a word prohibited in the multimedia logo according to multimedia naming requirements, including but not limited to: uncivilized words, racial discrimination words, etc.
  • the pre-trained recognition model may be used to process the reorganized multimedia identifier, so as to delete the first preset word in the reorganized multimedia identifier.
  • the recombined multimedia identifier is input into the recognition model, and the recognition model detects whether there is a first preset word in the reorganized multimedia identifier, deletes it if it exists, and outputs the deleted multimedia identifier.
  • the above recognition model may adopt a transformer-based bidirectional encoder representation (Bidirectional Encoder Representations from Transformer, BERT ) model.
  • Processing method 2 replace and process words of a preset type in the recombined multimedia identification, and the preset type includes person names and/or place names.
  • the name of the reorganized song list "Manchester by the Sea” contains the place name "Manchester”, and the place name can be replaced according to the location and characteristics of the place name, for example, replaced with "Western Town", so that The revised playlist for "Western Town by the Sea”.
  • the restructured multimedia identifier contains a person's name
  • a similar method can be used to replace the person's name, for example, replacing the person's name with "boy", “girl”, “lady” and so on.
  • a replacement model can be obtained through pre-training, and the preset type of words in the recombined multimedia identification can be replaced.
  • the recombined multimedia identifier is input into the replacement model, and the replacement model detects whether preset words such as place names and personal names are contained in the reorganized multimedia identifier, and if so, the preset words are replaced accordingly, and the replaced multimedia identifier is output.
  • the above replacement model can adopt the BERT model.
  • the same replacement model may be used for the replacement process of place names and personal names, and different replacement models may also be used, which is not limited in this embodiment. Processing method three: update the ungrammatical words in the restructured multimedia identification.
  • words that do not conform to grammar include but are not limited to: words with unreasonable collocations, words that are not fluent in the text, and the like.
  • words with unreasonable collocations words that are not fluent in the text, and the like.
  • it can be updated to "an apple”.
  • the text may be fluent and can be updated to "one penguin”.
  • an updated model may be obtained through pre-training, and the words in the reorganized multimedia identification that do not conform to the grammar are updated.
  • the reorganized multimedia identifier is input into the update model, and the update model detects whether the reorganized multimedia identifier contains words that do not conform to the grammar, and if so, the words that do not conform to the grammar are updated accordingly, and the updated multimedia identifier is output.
  • the above replacement model may adopt the BERT model. Processing method four: Perform synonym replacement processing on the words in the recombined multimedia identifier. An example is given in conjunction with FIG. 6 , and after synonymous replacement processing for the reorganized multimedia identifier "cafe by the sea", "cafe by the sea” can be obtained.
  • the reassembled multimedia identifier when the number of characters in the reassembled multimedia identifier is less than Or when it is equal to the preset threshold, the reassembled multimedia identifier may be deleted. It should be noted that, in practical applications, for each reassembled multimedia identifier, one or more of the above five processing methods may be used to obtain one or more modified multimedia identifiers. When multiple processing methods are used, the sequence of the multiple processing methods is not limited.
  • the target reference multimedia identifier may be determined among multiple reference multimedia identifiers, and the multimedia feature corresponding to the target reference multimedia identifier has the highest matching degree with the multimedia feature corresponding to the first multimedia information set.
  • the foregoing similarity may be determined according to the reference tag set corresponding to each reference multimedia identifier and the first tag set. Exemplary, in conjunction with the example shown in FIG. 4, in FIG. 4, since the reference label set 4 is the same as the first label set, it shows that the feature matching degree of the reference song list 4 and the song list to be named is the highest. Therefore, the reference The song list name 4 serves as the target reference multimedia identification.
  • the modified multimedia identifier with the highest similarity to the target reference multimedia identifier is determined as the target multimedia identifier.
  • the determined number of target multimedia identifiers is M, and M is an integer greater than or equal to 1.
  • multiple recombined multimedia identifiers are obtained by combining the words in multiple multimedia identifiers to be selected, and can generate a more semantically rich Rich and diverse reorganized multimedia logo. Furthermore, the multiple recombined multimedia identifiers are corrected to obtain multiple revised multimedia identifiers, and the target multimedia identifier is determined among the multiple revised multimedia identifiers, which ensures that the determined target multimedia identifier meets the requirements for multimedia naming, and improves the efficiency of the target multimedia identifier. the quality of.
  • FIG. 7 is a schematic diagram of an information processing process provided by an embodiment of the present disclosure. As shown in Figure 7, taking the song list as an example, the information processing process of this embodiment includes:
  • the characteristics of the first song list and the first song list features may include features of multiple dimensions such as genre, emotion, and tune.
  • the process of performing feature extraction on the song list to be named can refer to the description of the embodiment shown in FIG. 2 .
  • At least one song list name to be selected is determined from a plurality of reference song list names stored in the song list library.
  • the matching degree between the feature of the reference play list corresponding to the name of the play list to be selected and the feature of the first play list satisfies the preset condition.
  • FIG. 8 is a schematic structural diagram of an information processing device provided by an embodiment of the present disclosure.
  • the means may be in the form of software and/or hardware.
  • the apparatus may be a terminal device/server, or a processor, chip, chip module, module, unit, application program, etc. integrated into the terminal device/server. As shown in FIG.
  • the information processing apparatus 800 includes: a first acquiring module 801 , a second acquiring module 802 , a first determining module 803 and a second determining module 804 .
  • the first acquiring module 801 is configured to acquire the first multimedia information set to be processed, and the first multimedia information set includes a plurality of first multimedia information
  • the second acquiring module 802 is configured to Acquire reference information, where the reference information includes multiple reference multimedia identifiers, one reference multimedia identifier is used to indicate a reference multimedia information set, and one reference multimedia information set includes multiple reference multimedia information
  • the first determining module 803 is configured to According to the first multimedia information set, among the plurality of reference multimedia identifiers, at least one candidate multimedia identifier is determined, and the multimedia feature corresponding to the reference multimedia information set indicated by the candidate multimedia identifier is the same as the The matching degree between the multimedia features corresponding to the first multimedia information set satisfies a preset condition
  • the second determining module 804 is configured to determine, according
  • the first determining module 803 is specifically configured to: determine a first tag set according to multimedia features corresponding to the first multimedia information set, and the first tag set includes at least one feature tag ; According to the multimedia feature corresponding to the reference multimedia information set indicated by each reference multimedia identifier, determine a reference label set corresponding to the reference multimedia identifier, and the reference label set includes at least one feature label; The at least one candidate multimedia identifier is determined from the multiple reference multimedia identifiers according to the first tag set and the reference tag set corresponding to each reference multimedia identifier.
  • the first determining module 803 is specifically configured to: determine multiple reference feature tags according to a reference tag set corresponding to each reference multimedia identifier, and there is no repeated feature tag among the multiple reference feature tags; According to each reference multimedia identifier and the reference tag set corresponding to each reference multimedia identifier, determine the reference multimedia identifier set corresponding to each reference feature tag; according to the first tag set and the reference multimedia identifier set corresponding to each reference feature tag, The at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers.
  • the first determining module 803 is specifically configured to: determine at least one target feature tag among the plurality of reference feature tags according to the first tag set, where the target feature tag belongs to the first A tag set; determining the at least one candidate multimedia identifier according to the reference multimedia identifier set corresponding to the at least one target feature tag.
  • the second determining module 804 is specifically configured to: perform word segmentation processing on each multimedia identifier to be selected to obtain multiple words corresponding to the multimedia identifier to be selected; combining the words to obtain multiple recombined multimedia identifiers; performing correction processing on the multiple reassembled multimedia identifiers to obtain multiple revised multimedia identifiers; determining the target multimedia identifier in the multiple modified multimedia identifiers.
  • the second determining module 804 is specifically configured to: perform at least one of the following processes on the reassembled multimedia identifier to obtain the modified multimedia identifier: delete the reassembled multimedia identifier the first preset word in the reorganized multimedia identification; replace the preset type of words in the reorganized multimedia identification, and the preset type includes personal names and/or place names; update the ungrammatical words in the reorganized multimedia identification processing; performing synonym replacement processing on the words in the reorganized multimedia identifier; deleting the reassembled multimedia identifier whose number of characters is less than or equal to a preset threshold.
  • the second determining module 804 is specifically configured to: determine a target reference multimedia identifier among the multiple reference multimedia identifiers, where the reference multimedia feature corresponding to the target reference multimedia identifier is the same as the first multimedia identifier.
  • the matching degree between the multimedia features corresponding to the body information set is the best; the similarity between each modified multimedia identifier and the target reference multimedia identifier is obtained; according to the similarity between each modified multimedia identifier and the target reference multimedia identifier degree, determining the target multimedia identifier in the plurality of modified multimedia identifiers.
  • the second determining module 804 is specifically configured to: perform a sequence on the multiple modified multimedia identifiers in descending order of similarity between each modified multimedia identifier and the target reference multimedia identifier Sort processing; The first M modified multimedia identifiers after sorting are determined as the target multimedia identifiers, where M is an integer greater than or equal to 1.
  • the first multimedia information is any one of the following: audio, text, image or video.
  • the first multimedia information is a song, and the multimedia features include one or more dimensional features of genre, emotion, and genre.
  • the device in this embodiment further includes: a setting module, configured to set the identifier of the first multimedia information set as the target multimedia identifier; or, a display module, configured to display the The target multimedia identifier; or, a sending module, configured to send the target multimedia identifier to the preset device.
  • the information processing device provided in this embodiment can be used to execute the information processing method in any of the above method embodiments, and its implementation principle and technical effect are similar, and will not be repeated here.
  • an embodiment of the present disclosure further provides an electronic device. Referring to FIG. 9, it shows a schematic structural diagram of an electronic device 900 suitable for implementing the embodiments of the present disclosure.
  • the electronic device 900 may be a terminal device or a server.
  • the terminal device may include but not limited to such as a mobile phone, a notebook computer, a digital broadcast receiver, a personal digital assistant (Personal Digital Assistant, PDA for short), a tablet computer (Portable Android Device, PAD for short), a portable multimedia player (Portable Mobile terminals such as Media Player, PMP for short), vehicle-mounted terminals (such as vehicle-mounted navigation terminals), and fixed terminals such as digital televisions (Television, TV), desktop computers, etc.
  • PDA Personal Digital Assistant
  • PAD Personal Android Device
  • PMP Portable Multimedia player
  • vehicle-mounted terminals such as vehicle-mounted navigation terminals
  • fixed terminals such as digital televisions (Television, TV), desktop computers, etc.
  • the electronic device shown in FIG. 9 is only an example, and should not limit the functions and scope of use of the embodiments of the present disclosure. As shown in FIG.
  • an electronic device 900 may include a processing device (such as a central processing unit, a graphics processing unit, etc.) 901, which may be stored in a program in a read-only memory (Read Only Memory, ROM for short) 902 or from a storage device 908, the programs loaded into the random access memory (RAM for short) 903 execute various appropriate actions and processes. In the RAM 903, various programs and data necessary for the operation of the electronic device 900 are also stored.
  • the processing device 901 , ROM 902 and RAM 903 are connected to each other through a bus 904 .
  • An input/output (Input/Output, I/O) interface 905 is also connected to the bus 904 .
  • the following devices can be connected to the I/O interface 905: input devices 906 including, for example, a touch screen, touchpad, keyboard, mouse, camera, microphone, accelerometer, gyroscope, etc.; including, for example, a liquid crystal display (Liquid Crystal Display, LCD for short) ), an output device 907 such as a speaker, a vibrator, etc.; a storage device 908 including, for example, a magnetic tape, a hard disk, etc.; and a communication device 909.
  • the communication means 909 may allow the electronic device 900 to perform wireless or wired communication with other devices to exchange data. While FIG. 9 shows electronic device 900 having various means, it should be understood that implementing or having all of the means shown is not a requirement.
  • the processes described above with reference to the flowcharts can be implemented as computer software programs.
  • the embodiments of the present disclosure include a computer program product, which includes a computer program carried on a computer-readable medium, where the computer program includes program code for executing the method shown in the flowchart.
  • the computer program may be downloaded and installed from a network via communication means 909 , or from storage means 908 , or from ROM 902 .
  • the processing device 901 the above-mentioned functions defined in the methods of the embodiments of the present disclosure are executed.
  • the computer-readable medium mentioned above in the present disclosure may be a computer-readable signal medium or a computer-readable storage medium or any combination of the above two.
  • a computer-readable storage medium may be, for example, but not limited to, an electrical, magnetic, optical, electromagnetic, infrared, or semiconductor system, device, or device, or any combination thereof.
  • Computer readable storage media may include, but are not limited to: electrical connections with one or more conductors, portable computer disks, hard disks, random access memory (RAM), read only memory (ROM), erasable Programmable read-only memory (Erasable Programmable Read Only Memory, EPROM or flash memory), optical fiber, portable compact disk read-only memory (Compact Disk Read Only Memory, CD-ROM optical storage device, magnetic storage device, or any suitable combination of the above.
  • a computer-readable storage medium may be any tangible medium containing or storing a program, and the program may be used by or in combination with an instruction execution system, device, or device.
  • a computer-readable signal medium may be A data signal included in the baseband or propagated as part of a carrier, carrying computer-readable program codes.
  • This propagated data signal can take various forms, including but not limited to electromagnetic signals, optical signals, or any of the above-mentioned suitable
  • the computer-readable signal medium can also be any computer-readable medium other than the computer-readable storage medium, and the computer-readable signal medium can be sent, propagated or transported for use by or in combination with an instruction execution system, device or device program.
  • the program code contained on the computer-readable medium can be transmitted by any appropriate medium, including but not limited to: electric wire, optical cable, radio frequency (Radio Frequency, RF), etc., or any suitable combination of the above.
  • the above-mentioned computer can be The read medium may be included in the above-mentioned electronic device, or may exist independently without being assembled into the electronic device.
  • the above-mentioned computer-readable medium carries one or more programs, and when the above-mentioned one or more programs are read by the electronic When the device is executed, the electronic device is made to perform the methods shown in the above-mentioned embodiments.
  • Computer program codes for performing the operations of the present disclosure can be written in one or more programming languages or combinations thereof, and the above-mentioned programming languages include oriented Object programming languages—such as Java, Smalltalk, C++, also include conventional procedural programming languages—such as "C" language or similar programming languages.
  • the program code can be executed completely on the user's computer and partially on the user's computer. Execute on the computer, as a stand-alone software package, partly on the user's computer and partly on the remote computer, or entirely on the remote computer or server.
  • the remote computer can be over any kind of network - Including local area network (Local Area Network, referred to as LAN) or wide area network (Wide Area Network, referred to as WAN) - connected to the user's computer, or can be connected to an external computer (such as using an Internet service provider to connect through the Internet).
  • LAN Local Area Network
  • WAN Wide Area Network
  • each block in the flowchart or block diagram may represent a module, program segment, or part of code that contains one or more logic functions for implementing the specified executable instructions.
  • the functions noted in the block may occur out of the order noted in the figures. For example, two blocks shown in succession may, in fact, be executed substantially concurrently, or they may sometimes be executed in the reverse order, depending upon the functionality involved.
  • each block in the block diagrams and/or flowcharts, and combinations of blocks in the block diagrams and/or flowcharts can be implemented by a dedicated hardware-based system that performs specified functions or operations. , or may be implemented by a combination of special purpose hardware and computer instructions.
  • the units involved in the embodiments described in the present disclosure may be implemented by means of software or by means of hardware. Wherein, the name of the unit does not constitute a limitation on the unit itself under certain circumstances, for example, the first obtaining unit may also be described as "a unit that obtains at least two Internet Protocol addresses".
  • the functions described herein above may be performed at least in part by one or more hardware logic components.
  • exemplary types of hardware logic components include: Field Programmable Gate Array (Field Programmable Gate Array, FPGA), Application Specific Integrated Circuit (Application Specific Integrated Circuit, ASIC), Application Specific Standard Products (Application Specific Standard Product, ASSP), System-on-chip (SOC), Complex Programmable Logic Device (Complex Programmable Logic Device, CPLD) and so on.
  • a machine-readable medium may be a tangible medium, which may contain or store a program for use by or in combination with an instruction execution system, device, or device.
  • a machine-readable medium may be a machine-readable signal medium or a machine-readable storage medium.
  • a machine-readable medium may include, but is not limited to, an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system, device, or device, or any suitable combination of the foregoing. More specific examples of machine-readable storage media would include one or more wire-based electrical connections, portable computer disks, hard disks, Random Access Memory (RAM), Read Only Memory (ROM), Erasable Programmable Read Only Memory (EPROM or flash memory), optical fiber, compact disk read-only memory (CD-ROM), optical storage device, magnetic storage device, or any suitable combination of the above.
  • an information processing method including: acquiring a first multimedia information set to be processed, and the first multimedia information set includes a plurality of The first multimedia information; Acquiring reference information, the reference information includes multiple reference multimedia identifiers, one reference multimedia identifier is used to indicate a reference multimedia information set, and one reference multimedia information set includes multiple reference multimedia information; according to In the first multimedia information set, at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers, and the multimedia feature corresponding to the reference multimedia information set indicated by the candidate multimedia identifier is the same as the first multimedia identifier.
  • determining at least one candidate multimedia identifier among the plurality of reference multimedia identifiers includes: according to the first multimedia The multimedia feature corresponding to the body information set, determine a first tag set, the first tag set includes at least one feature tag; according to the multimedia feature corresponding to the reference multimedia information set indicated by each reference multimedia identifier, determine the reference A reference label set corresponding to a multimedia identifier, where the reference label set includes at least one feature label; according to the first label set and the reference label set corresponding to each reference multimedia identifier, determine the At least one candidate multimedia ID.
  • determining the at least one candidate multimedia identifier among the multiple reference multimedia identifiers according to the first tag set and the reference tag set corresponding to each reference multimedia identifier includes: Determining a plurality of reference feature tags according to the reference tag set corresponding to the reference multimedia identifiers, and there is no repeated feature tag in the plurality of reference feature tags; according to the reference multimedia identifiers and the reference The reference tag set corresponding to the multimedia identifier determines the reference multimedia identifier set corresponding to each reference feature tag; according to the first tag set and the reference multimedia identifier set corresponding to each reference feature tag, among the multiple reference multimedia tags Determine the at least one candidate multimedia identifier in the identifier.
  • the at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers.
  • the method includes: according to the first tag set, determining at least one target feature tag among the plurality of reference feature tags, the target feature tag belonging to the first tag set; according to the reference corresponding to the at least one target feature tag A set of multimedia identifiers, determining the at least one candidate multimedia identifier.
  • determining a target multimedia identifier corresponding to the first multimedia information set includes: performing word segmentation processing on each candidate multimedia identifier, obtaining multiple words corresponding to the multimedia identifiers to be selected; combining the multiple words corresponding to the multimedia identifiers to be selected to obtain multiple reorganized multimedia identifiers; performing correction processing on the multiple reassembled multimedia identifiers to obtain multiple modifying multimedia identifiers; determining the target multimedia identifier among the plurality of modified multimedia identifiers.
  • performing correction processing on the reassembled multimedia identifier to obtain the modified multimedia identifier includes: performing at least one of the following processes on the reassembled multimedia identifier, Obtaining the modified multimedia identifier: deleting the first preset word in the reorganized multimedia identifier; replacing the preset type of words in the reorganized multimedia identifier, the preset type including personal names and/or place names; Updating words in the reorganized multimedia identifier that do not conform to grammar; performing synonym replacement processing on words in the reorganized multimedia identifier; deleting reorganized multimedia identifiers whose number of characters is less than or equal to a preset threshold.
  • determining the target multimedia identifier in the plurality of modified multimedia identifiers includes: determining a target reference multimedia identifier in the plurality of reference multimedia identifiers, the target reference multimedia identifier The matching degree between the corresponding multimedia feature and the multimedia feature corresponding to the first multimedia information set is the best; obtaining the similarity between each modified multimedia identifier and the target reference multimedia identifier; according to each modified The similarity between the multimedia identifier and the target reference multimedia identifier is used to determine the target multimedia identifier among the plurality of revised multimedia identifiers.
  • determining the target multimedia identifier among the plurality of modified multimedia identifiers includes: sorting the multiple modified multimedia identifiers according to the descending order of similarity between the modified multimedia identifiers and the target reference multimedia identifier; determining the sorted first M modified multimedia identifiers as The target multimedia identifier, the M is an integer greater than or equal to 1.
  • the first multimedia information is any one of the following: audio, text, image or video.
  • the first multimedia information is a song
  • the multimedia features include features in one or more dimensions of genre, emotion, and genre.
  • the method further includes: The set identifier is set as the target multimedia identifier; or, the target multimedia identifier is displayed; or, the target multimedia identifier is sent to the preset device.
  • an information processing device including: a first acquiring module, configured to acquire a first multimedia information set to be processed, the first multimedia The body information set includes a plurality of first multimedia information; the second acquiring module is configured to acquire reference information, the reference information includes a plurality of reference multimedia identifiers, and one reference multimedia identifier is used to indicate a reference multimedia information set, A reference multimedia information set includes multiple reference multimedia information; a first determining module, configured to determine at least one candidate multimedia identifier among the multiple reference multimedia identifiers according to the first multimedia information set, The matching degree between the multimedia features corresponding to the reference multimedia information set indicated by the candidate multimedia identifier and the multimedia features corresponding to the first multimedia information set satisfies a preset condition; The at least one candidate multimedia identifier is used to determine a target multimedia identifier corresponding to the first multimedia information set.
  • the first determining module is specifically configured to: determine a first label set according to the multimedia feature corresponding to the first multimedia information set, and the first label set includes at least one feature tag; according to the multimedia feature corresponding to the reference multimedia information set indicated by each reference multimedia identifier, determine the reference tag set corresponding to the reference multimedia identifier, and the reference tag set includes at least one feature tag; according to the first A set of labels and a set of reference labels corresponding to each reference multimedia identity, wherein the at least one candidate multimedia identity is determined among the plurality of reference multimedia identity.
  • the first determining module is specifically configured to: determine a plurality of reference feature tags according to the set of reference tags corresponding to the reference multimedia identifiers, and none of the plurality of reference feature tags There are repeated feature tags; according to the reference multimedia identifiers and the reference tag sets corresponding to the reference multimedia identifiers, determine a reference multimedia identifier set corresponding to each reference feature tag; according to the first tag set and Each reference feature tag corresponds to a set of reference multimedia identifiers, and the at least one candidate multimedia identifier is determined among the plurality of reference multimedia identifiers.
  • the first determining module is specifically configured to: determine at least one target feature tag among the plurality of reference feature tags according to the first tag set, and the target feature tag belongs to all the first tag set; and determine the at least one candidate multimedia identifier according to the reference multimedia identifier set corresponding to the at least one target feature tag.
  • the second determination module is specifically configured to: perform word segmentation processing on each multimedia identifier to be selected, and obtain multiple words corresponding to the multimedia identifier to be selected; performing combination processing on the multiple words to obtain multiple reassembled multimedia identifiers; performing correction processing on the multiple reassembled multimedia identifiers to obtain multiple revised multimedia identifiers; determining the target multimedia identifier among the plurality of modified multimedia identifiers.
  • the second determining module is specifically configured to: perform at least one of the following processes on the reassembled multimedia identifier to obtain the modified multimedia identifier: delete the reassembled multimedia identifier The first preset word in the multimedia identifier; replacing the preset type of words in the reorganized multimedia identifier, the preset type includes personal names and/or place names; and grammatically inconsistent words in the reorganized multimedia identifier Perform update processing; perform synonym replacement processing on words in the reorganized multimedia identifier; delete reassembled multimedia identifiers whose number of characters is less than or equal to a preset threshold.
  • the second determination module is specifically configured to: determine a target reference multimedia identifier among the multiple reference multimedia identifiers, where the reference multimedia feature corresponding to the target reference multimedia identifier is the same as the first The matching degree between the multimedia features corresponding to the multimedia information set is the best; obtaining the similarity between each modified multimedia identifier and the target reference multimedia identifier; according to each modified multimedia identifier and the target reference multimedia identifier The similarity between the multiple modified multimedia identifiers is used to determine the target multimedia identifier.
  • the second determination module is specifically configured to: according to the descending order of the similarity between the modified multimedia identifiers and the target reference multimedia identifier, for the multiple The modified multimedia identifiers are sorted; the first M modified multimedia identifiers after sorting are determined as the target multimedia identifiers, where M is an integer greater than or equal to 1.
  • the first multimedia information is any one of the following: audio, text, image or video.
  • the first multimedia information is a song, and the multimedia features include features in one or more dimensions of genre, emotion, and genre.
  • the information processing device further includes: a setting module, configured to set the identifier of the first multimedia information set as the target multimedia identifier; or, a display module, configured to display said target multimedia identification; or, A sending module, configured to send the target multimedia identifier to the preset device.
  • a setting module configured to set the identifier of the first multimedia information set as the target multimedia identifier
  • a display module configured to display said target multimedia identification
  • a sending module configured to send the target multimedia identifier to the preset device.
  • an electronic device including: at least one processor and a memory; the memory stores computer-executable instructions; the at least one processor executes the memory-stored The computer executes instructions, so that the at least one processor executes the information processing method described in the above first aspect and various possible implementation manners of the first aspect.
  • a computer-readable storage medium stores computer-executable instructions, and when a processor executes the computer-executable instructions, Realize the information processing method described in the above first aspect and various possible implementation manners of the first aspect.
  • a computer program product is provided, including a computer program, and when the computer program is executed by a processor, various possible implementations of the first aspect and the first aspect can be realized. The information processing method described in the method.
  • a computer program is provided.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

摘要本公开实施例提供一种信息处理方法、装置、设备、存储介质及程序,该方法包括:获取待处理的第一多媒体信息集合,第一多媒体信息集合中包括多个第一多媒体信息;获取参考信息,参考信息中包括多个参考多媒体标识;根据第一多媒体信息集合,在多个参考多媒体标识中,确定出至少一个待选多媒体标识,待选多媒体标识所指示的参考多媒体信息集合对应的多媒体特征与第一多媒体信息集合对应的多媒体特征之间的匹配度满足预设条件;根据至少一个待选多媒体标识,确定第一多媒体信息集合对应的目标多媒体标识。通过上述过程,可以自动化的确定第一多媒体信息集合对应的目标多媒体标识,节省了人力和时间,提高了目标多媒体标识的质量。

Description

信 息处 理方 法 、 装置、 设备、 存储介质 及程 序 相关申请的交叉引用 本公开要求于 2022年 2月 21 日提交的、 申请号为 202210154951.9、 名称为 “信息处理 方法、 装置、 设备、 存储介质及程序” 的中国专利申请的优先权, 其全部内容通过引用并入 本文。 技术领域 本 公开实施例涉及多媒体技术领域, 尤其涉及一种信息处理方法、 装置、 设备、 存 储介质及程序。 背景技术 随着多媒体技术的发展, 用户通过终端设备使用多媒体信息的场景逐渐增多。 例如, 用户可以通过终端设备观看视频、 收听音乐、 阅读书籍等。 一些应用场 景中, 可以对多媒体信息进行分组管理。 下面以音乐为例进行举例说明, 音乐平台可以对数据库中的歌曲采用多元化的方式进行组合 , 将多个歌曲组成一个歌单, 以歌单的形式推送给用户 。 另外, 用户也可以根据自己的喜好, 将多个歌曲创建为一个 歌单。 采用 歌单的形式对音乐进行管理之后, 需要为每个歌单确定歌单名称。 相关技术中, 需要人工确定歌单名称, 这样, 一方面, 需要耗费大量的人力和时间成本, 另一方面, 歌单名称的质量无法保证。 发明内容 本公 开实施例提供一种信息处理方法、 装置、 设备、 存储介质及程序。 第一 方面, 本公开实施例提供一种信息处理方法, 包括: 获 取待处理的第一多媒体信息集合, 所述第一多媒体信息集合中包括多个第一多媒 体信息; 获 取参考信息, 所述参考信息中包括多个参考多媒体标识, 一个参考多媒体标识用 于指示一个参考多媒体信息集合, 一个参考多媒体信息集合中包括多个参考多媒体信息; 根据 所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待 选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集合对应的多媒体特征与 所述第一多媒体信息集合对应的多媒体特征之间的匹配度满足预设条件 ; 根据 所述至少一个待选多媒体标识, 确定所述第一多媒体信息集合对应的目标多媒 体标识。 第二 方面, 本公开实施例提供一种信息处理装置, 包括: 第一 获取模块, 用于获取待处理的第一多媒体信息集合, 所述第一多媒体信息集合 中包括多个第一多媒体信息; 第二 获取模块, 用于获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一 个参考多媒体标识用于指示一个 参考多媒体信息集合, 一个参考多媒体信息集合中包括 多个参考多媒体信息; 第一确定模块 , 用于根据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待选多媒体标识 , 所述待选多媒体标识所指示的参考多媒体信息集合对 应的多媒体特征与所述第一 多媒体信息集合对应的多媒体特征之间的匹配度满足预设条 件; 第二确 定模块, 用于根据所述至少一个待选多媒体标识, 确定所述第一多媒体信息 集合对应的目标多媒体标识。 第三方面 , 本公开实施例提供一种电子设备, 包括: 处理器和存储器; 所述存储器存储计 算机执行指令; 所述 处理器执行所述计算机执行指令, 实现如第一方面以及第一方面各种可能的实 现方式中的信息处理方法。 第 四方面, 本公开实施例提供一种计算机可读存储介质, 所述计算机可读存储介质 中存储有计算机执行指令 , 当处理器执行所述计算机执行指令时, 实现如上第一方面以 及第一方面各种可能的实现方式中的信息处理方法。 第五 方面, 本公开实施例提供一种计算机程序产品, 包括计算机程序, 所述计算机 程序被处理器执行时实现如第 一方面以及第一方面各种可能的实现方式中的信息处理方 法。 第六 方面, 本公开实施例提供一种计算机程序, 所述计算机程序被处理器执行时实 现如第一方面以及第一方面各种可能的实现方式中的信息处理方法 。 本公 开实施例提供的信息处理方法、 装置、 设备、 存储介质及程序, 该方法包括: 获取待处理的第一多媒体信 息集合, 第一多媒体信息集合中包括多个第一多媒体信息; 获取参考信息, 所述参考信息中包括多个参考多媒体标识; 根据第一多媒体信息集合, 在所述多个参考多媒体标识 中, 确定出至少一个待选多媒体标识, 所述待选多媒体标识 所指示的参考多媒体信息集合对 应的多媒体特征与所述第一多媒体信息集合对应的多媒 体特征之间的匹配度满足预设 条件; 根据所述至少一个待选多媒体标识, 确定所述第一 多媒体信息集合对应的目标多媒体标识。 附图说明 为了更清楚地说明本公开实施例或现有技术中的技术方案, 下面将对实施例或现有技术 描述中所需要使用的附图作一简单地介绍, 显而易见地, 下面描述中的附图是本公开的一些 实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附 图获得其他的附图。 图 1为本公开实施例提供的一种应用场景的示意图; 图 2为本公开实施例提供的一种信息处理方法的流程示意图; 图 3为本公开实施例提供的另一种信息处理方法的流程示意图; 图 4为本公开实施例提供的一种待选多媒体标识的确定过程的示意图; 图 5为本公开实施例提供的又一种信息处理方法的流程示意图; 图 6为本公开实施例提供的目标歌单名的确定过程的示意图; 图 7为本公开实施例提供的一种信息处理过程的示意图; 图 8为本公开实施例提供的一种信息处理装置的结构示意图; 图 9为本公开实施例提供的一种电子设备的结构示意图。 具体实施方式 为使本 公开实施例的目的、 技术方案和优点更加清楚, 下面将结合本公开实施例中 的附图, 对本公开实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例 是本公开一部分实施例 , 而不是全部的实施例。 基于本公开中的实施例, 本领域普通技 术人员在没有作出创造性劳动 前提下所获得的所有其他实施例, 都属于本公开保护的范 围。 本公 开提供一种信息处理方法、 装置、 设备、 存储介质及程序, 可应用于需要确定 第一多媒体信息集合对应 的目标多媒体名称的场景。 其中, 第一多媒体信息集合包括多 个第一多媒体信息。 本公开提供的技术方案中, 可以根据多个参考多媒体标识, 自动化 的确定第一多媒体信息集合对应的目标多媒体标识。 这样, 一方面, 节省了人力和时间, 另一方面, 提高了目标多媒体标识的质量。 在本公开实施例 中, 多媒体信息包括但不限于: 音频、 文本、 图像、 视频等。 例如, 第一多媒体信息集合可 以为一个歌单, 或者, 还可以为一个书单, 或者, 还可以是一组 视频, 或者, 还可以为一组图像。 第一 多媒体信息集合对应的多媒体标识是指用于标识第一多媒体信息集 合的信息。 多媒体标识也可以称为多媒体 名称。 例如, 当第一多媒体信息集合为歌单时, 第一多媒 体信息集合对应的多媒体标识 可以为歌单名。 需要说明的是, 本公开实施例对于多媒体 标识的形式不做限定, 示例性的, 可以为词语、 短语、 句子、 段落等。 下面 以第一多媒体信息集合是歌单为例, 对本公开实施例的应用场景进行举例说明。 图 1为本公开实施例提供的一种应用场景的示意图。 如图 1所示, 假设需要对某个 歌单进行命名。 待命名歌单中包括: 歌曲 1、 歌曲 2、 歌曲 3、 …、 歌曲 N。 将待命名 歌单输入至信息处理装置 中, 信息处理装置可以参考歌单库中各参考歌单名称, 确定待 命名歌单对应的目标歌单名称。 应理解 , 信息处理装置可以为终端设备或者服务器, 还可以为集成到终端设备或者 服务器中的装置。 其中, 终端设备可以是具有多媒体交互功能的任意电子设备, 包括但 不限于: 智能手机、 平板电脑、 笔记本电脑、 智能电视、 智能穿戴设备、 智能家居设备、 智能车载设备、 智能音箱等。 后续附图中在示例终端设备的显示页面时, 以手机页面为 例进行示例。 服务器可以为云服务器, 又称为云计算服务器或云主机, 是云计算服务体 系中的一项主机产品 。 服务器也可以为分布式系统的服务器, 或者是结合了区块链的服 务器。 下面 以具体的实施例对本公开的技术方案进行详细说明。 下面这几个具体的实施例 可以相互结合, 对于相同或相似的概念或过程可能在某些实施例不再赘述。 图 2 为本公开实施例提供的一种信息处理方法的流程示意图。 本实施例的执行主体 可以为信息处理设备。 如图 2所示, 本实施例的方法包括:
S201: 获取待处理的第一多媒体信息集合, 所述第一多媒体信息集合中包括多个第 一多媒体信息。 可选 的, 第一多媒体信息为如下任意一种: 音频、 文本、 图像或视频。 当第一多媒 体信息为音频时, 第一多媒体信息集合可以包括多个歌曲, 或者, 多个戏曲等。 当第一 多媒体信息为文本时, 第一多媒体信息集合可以包括多个文本, 例如, 多个文章、 多个 书籍等。 当第一多媒体信息为图像时, 第一多媒体信息集合可以包括多个图像。 当第一 多媒体信息为视频时, 第一多媒体信息集合可以包括多个视频, 例如, 多个电视剧, 或 者多个电影, 或者多个小视频等。 本实施 例中, 第一多媒体信息集合为待命名的多媒体信息集合。 即, 需要对第一多 媒体信息集合确定 目标多媒体标识。 该目标多媒体标识用于反映第一多媒体信息集合中 的各第一多媒体信息的特征。 举例 而言, 假设第一多媒体信息集合包括多个歌曲, 第一多媒体信息集合可以称为 一个歌单。 采用本实施例的方法, 可以为该歌单生成歌单名称, 该歌单名称用于反映该 歌单中的歌曲的特征。
S202: 获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一个参考多媒体 标识用于指示一个参考多媒体信 息集合, 一个参考多媒体信息集合中包括多个参考多媒 体信息。 本实施 例中, 参考信息是指在自动化的确定第一多媒体信息集合对应的目标多媒体 标识的过程中, 所需要参考的信息。 参考信息中多个参考多媒体信息集合各自对应多媒 体标识。 以第一多媒体信息集合是歌单为例, 参考信息可以称为歌单库, 歌单库中包括 多个参考歌单对应的参考歌单名称。 每个参考歌单中包括多个参考歌曲。
S203: 根据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少 一个待选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集合对应的多媒体 特征与所述第一多媒体信息集合对应的多媒体特征之间的匹配度满足预设条件 。 示例性 的, 可以对第一多媒体信息集合进行特征提取, 得到第一多媒体信息集合对 应的多媒体特征。 并且, 针对参考信息中的每个参考多媒体标识, 对该参考多媒体标识 所指示的参考多媒体信息集合进 行特征提取, 得到该参考多媒体标识所指示的参考多媒 体信息集合对应的多媒体特征 。 进而, 可以确定第一多媒体信息集合对应的多媒体特征 与各参考多媒体标识所指示 的参考多媒体信息集合对应的多媒体特征之间的匹配度, 并 根据所述匹配度在多个参考多媒体标识中确定至少一个待选多媒体标识 。 具体而 言, 可以将匹配度满足预设条件的参考多媒体标识, 确定为待选多媒体标识。 例如, 针对每个参考多媒体标识, 若该参考多媒体标识所指示的参考多媒体信息集合对 应的多媒体特征与第一多媒体信 息集合对应的多媒体特征之间的匹配度大于或等于预设 阈值, 则将该参考多媒体标识确定为待选多媒体标识。 需要说明的是, 当第一多媒体信息的形式不同时, 通常对应的特征提取方式也有所 不同。 本实施例对于特征提取的方式不做限定。 以第一多媒体信息集合是歌单为例, 可以从多个维度对歌单中的歌曲进行特征提取, 得到第一多媒体信息集合对应 的多媒体特征。 其中, 多个维度包括但不限于: 曲风、 情 感、 曲种等。 换言之, 第一多媒体信息集合对应的多媒体特征中包括曲风、 情感、 曲种 中的一个或者多个维度的特征。 示例性 的, 可以采用梅尔倒频谱 (Mel-Frequency Cepstral Coefficients, MFCC)、 滤波 器组 (Filter Banks, Fbanks)等特征提取方式, 提取得到待命名歌单中的歌曲的特征。 应理解 , 参考多媒体信息集合对应的多媒体特征的提取方式, 与第一多媒体信息集 合对应的多媒体特征的提取方式是类似的, 此处不做赘述。
S204: 根据所述至少一个待选多媒体标识, 确定所述第一多媒体信息集合对应的目 标多媒体标识。 本实施 例中, 在确定第一多媒体信息集合对应的目标多媒体标识时, 可以参考各待 选多媒体标识来确定。 一个示例中, 可以在所述至少一个待选多媒体标识中, 确定目标 多媒体标识。 另一个示例中, 可以对所述至少一个待选多媒体标识进行处理, 得到多个 处理后的待选多媒体标识, 在多个处理后的待选多媒体标识中, 确定目标多媒体标识。 为 了便于描述和理解, 以第一多媒体信息集合是歌单为例进行举例说明。 可以根据 待命名歌单, 从歌单库 (即参考信息) 存储的多个参考歌单名称中确定出至少一个待选 歌单名称, 待选歌单名称指示的参考歌单的歌单特征与待命名歌单的歌单特征之间的匹 配度满足预设条件。 进而, 根据各待选歌单名称, 来确定待命名歌单的目标歌单名称。 例如, 将某个待选歌单名称作为目标歌单名称; 或者, 对某个待选歌单名称进行修正, 得到目标歌单名称; 或者, 对多个待选歌单名称进行重组和修正处理, 得到目标歌单名 称。 下面 , 继续以歌单为例, 说明本实施例的几种应用场景。 一个示例场景 中, 信息处理设备对歌曲库中的歌曲进行聚类处理, 形成多个聚类簇。 每个聚类簇中包括的多个歌 曲形成一个歌单, 从而得到多个歌单。 进而, 信息处理设备 针对多个歌单中的每个第一歌 单执行本实施例的方法, 得到第一歌单对应的歌单名称, 并将第一歌单的名称设置为该歌单名称。 该示例场景中, 信息处理设备可以为服务器。 另一个示 例场景中, 信息处理设备响应于用户输入的创建歌单的操作请求, 根据该 操作请求确定待创建的第一歌单 。 进而, 针对第一歌单执行本实施例的方法, 得到第一 歌单对应的歌单名称 。 信息处理设备将第一歌单的名称设置为该歌单名称, 或者显示该 歌单名称。 该示例场景中, 信息处理设备可以为终端设备。 又一个 示例场景中, 终端设备响应于用户输入的创建歌单的操作请求, 确定待创建 的第一歌单, 并生成歌单命名请求, 歌单命名请求中包括第一歌单。 信息处理设备接收 终端设备发送的歌单命名请求 。 信息处理设备根据第一歌单执行本实施例的方法, 得到 第一歌单对应的歌单名称 。 信息处理设备将该歌单名称发送至终端设备。 终端设备对歌 单名称进行显示, 或者, 将第一歌单的名称设置为该歌单名称。 该示例场景中, 信息处 理设备可以为服务器。 需要说明的是, 本实施例对于 S201至 S202的执行顺序不做限定。 二者的执行顺序 可以互换, 或者, 二者还可以同时执行。 本实施 例提供的信息处理方法, 包括: 获取待处理的第一多媒体信息集合, 第一多 媒体信息集合中包括多个第一 多媒体信息; 获取参考信息, 参考信息中包括多个参考多 媒体标识, 根据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少 一个待选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集合对应的多媒体 特征与所述第一多媒体信息集 合对应的多媒体特征之间的匹配度满足预设条件; 根据所 述至少一个待选多媒体标识 , 确定所述第一多媒体信息集合对应的目标多媒体标识。 通 过上述过程, 可以根据多个参考多媒体标识, 自动化的确定第一多媒体信息集合对应的 目标多媒体标识。 这样, 一方面, 节省了人力和时间, 另一方面, 提高了目标多媒体标 识的质量。 在上述 图 2所示实施例的基础上, 下面结合一个具体的实施例对图 2所示实施例中 S203的实现方式进行详细说明。 图 3为本公开实施例提供的另一种信息处理方法的流程示意图。 如图 3所示, 本实 施例的方法, 包括:
S301: 根据所述第一多媒体信息集合对应的多媒体特征, 确定第一标签集合, 所述 第一标签集合中包括至少一个特征标签。 本实施 例, 特征标签是指通过对多媒体特征进行分类得到的类别。 换言之, 特征标 签可用于指示多媒体特征 的类别。 其中, 可以从多个维度对多媒体特征进行分类处理, 得到多个特征标签。 为 了便于理解, 下面结合图 4对待选多媒体标识的确定方式进行举例说明。 图 4为本公开实施例提供的一种待选多媒体标识的确定过程的示意图。 如图 4所示, 第一歌单特征 (即第一多媒体信息集合对应的多媒体特征) 是通过对待命名歌单进行特 征提取得到的歌单特征 。 可以从曲风、 情感、 曲种等多个维度, 对第一歌单特征进行分 类处理, 得到第一标签集合。 第一标签集合中包括各维度对应的特征标签。 其中, 曲风 维度对应的特征标签包括但不 限于: 中国风、 流行、 古典、 嘻哈等。 情感维度对应的特 征标签包括但不限于: 中性、 欢乐、 平静、 低沉、 悲伤等。 曲种维度对应的特征标签包 括但不限于: 民谣、 迪斯科、 重金属、 节奏布鲁斯 (R&B)。 举例 而言, 假设从曲风维度对第一歌单特征进行分类处理得到的特征标签为 “中国 风”, 从情感维度对第一歌单特征进行分类处理得到的特征标签为 “欢乐”, 从曲种维度 对第一歌单特征进行分类处理得 到的特征标签为 “民谣”, 则第一标签集合为{中国风、 欢乐、 民谣}。 参见 图 4, 为了便于后续描述, 假设针对第一歌单特征, 从曲风维度得到的特征标签 为 xl , 从情感维度得到的特征标签为 y3 , 从曲种维度得到的特征标签为 z3 , 则第一标签 集合记为{标签 xl , 标签 y3 , 标签 z3}。
S302: 根据每个参考多媒体标识所指示的参考多媒体信息集合对应的多媒体特征, 确定该参考多媒体标识对应 的参考标签集合, 所述参考标签集合中包括至少一个特征标 签。 与上述 S301类似的, 可以对每个参考多媒体标识所指示的参考多媒体信息集合对应 的多媒体特征进行分类处理 , 得到该参考多媒体标识对应的参考标签集合。 这样, 可以 得到多个参考标签集合。 继续参 见图 4, 针对歌单库中的每个参考歌单, 从曲风、 情感、 曲种等多个维度, 对 该参考歌单对应的参考歌单特征进行分类处理, 得到参考标签集合。 例如: 参考 歌单 1得到的参考标签集合 1为{标签 xl , 标签 yl , 标签 z3}; 参考 歌单 2得到的参考标签集合 2为{标签 x2, 标签 yl , 标签 z2}; 参考 歌单 3得到的参考标签集合 3为{标签 x3 , 标签 y2, 标签 zl}; 参考 歌单 4得到的参考标签集合 4为{标签 xl , 标签 y3 , 标签 z3}; 参考 歌单 5得到的参考标签集合 5为{标签 xl , 标签 y3 , 标签 zl}。
S303: 根据所述第一标签集合以及各参考多媒体标识对应的参考标签集合, 在所述 多个参考多媒体标识中确定所述至少一个待选多媒体标识。 一种 可能的实现方式中, 可以采用如下方式确定出至少一个待选多媒体标识:
( 1 ) 根据各参考多媒体标识对应的参考标签集合, 确定多个参考特征标签, 所述多 个参考特征标签中不存在重复的特征标签。 示例 性的, 可以通过对各参考多媒体标识对应的参考标签集合中的特征标签进行去 重处理, 得到多个参考特征标签。 例如 , 结合图 4 所示举例, 对多个参考标签集合中的特征标签进行去重处理, 得到 的多个参考特征标签为: 标签 xl , 标签 x2, 标签 x3 , 标签 yl , 标签 y2, 标签 y3 , 标签 zl , 标签 z2, 标签 z3。
(2) 根据各参考多媒体标识、 以及各参考多媒体标识对应的参考标签集合, 确定每 个参考特征标签对应的参考多媒体标识集合。 示例 性的, 每个参考特征标签对应的参考多媒体标识集合的确定方式如下: 针对每 个参考多媒体标识, 判断该参考多媒体标识对应的参考标签集合中是否包括该参考特征 标签, 若是, 则将该参考多媒体标识添加到该参考特征标签对应的参考多媒体标识集合 中。 继续参 见图 4, 采用上述方式, 可以确定出每个参考特征标签对应的参考歌单名称集 合如下: 标签 xl :{参考歌单名 1 , 参考歌单名 4, 参考歌单名 5}; 标签 x2:{ 参考歌单名 2}; 标签 x3:{ 参考歌单名 3}; 标签 yl :{ 参考歌单名 1 , 参考歌单名 2}; 标签 y2:{ 参考歌单名 3}; 标签 y3:{ 参考歌单名 4, 参考歌单名 5}; 标签 zl :{ 参考歌单名 3 , 参考歌单名 5}; 标签 z2:{ 参考歌单名 2}; 标签 z3:{ 参考歌单名 1 , 参考歌单名 4};
( 3 ) 根据所述第一标签集合和每个参考特征标签对应的参考多媒体标识集合, 在所 述多个参考多媒体标识中确定所述至少一个待选多媒体标识 。 示例性 的, 根据所述第一标签集合, 在所述多个参考特征标签中确定至少一个目标 特征标签, 所述目标特征标签属于所述第一标签集合; 根据所述至少一个目标特征标签 对应的参考多媒体标识集合 , 确定所述至少一个待选多媒体标识。 例如, 可以对至少一 个目标特征标签对应的参考 多媒体标识集合中的参考多媒体标识进行去重处理, 得到至 少一个待选多媒体标识。 结合 图 4所不举例, 由于第一标签集合为{标签 xl , 标签 y3 , 标签 z3}, 标签 xl对 应的参考歌单名称集合为{参考歌单名 1 , 参考歌单名 4, 参考歌单名 5}, 标签 y3对应的 参考歌单名称集合为{参考歌单名 4,参考歌单名 5),标签 z3对应的参考歌单名称集合为 {参考歌单名 1 ,参考歌单名 4}。对上述 3个参考歌单名称集合中的歌单名进行去重处理, 得到 3个待选歌单名, 分别为: 参考歌单名 1、 参考歌单名 4和参考歌单名 5。 本实施 例提供的信息处理方法中, 通过根据第一多媒体信息集合对应的第一标签集 合、 以及各参考多媒体标识对应的参考标签集合, 在所述多个参考多媒体标识中确定至 少一个待选多媒体标识 , 保证了确定出的待选多媒体标识所指示的参考多媒体信息集合 对应的多媒体特征与第一多媒体 信息集合对应的多媒体特征之间的匹配性, 进而根据至 少一个待选多媒体标识, 确定目标多媒体标识, 提高了目标多媒体标识的质量。 在上述任 意实施例的基础上,下面结合一个具体的实施例,对图 2所示实施例中 S204 的实现方式进行详细说明, 即, 如何根据至少一个待选多媒体标识确定目标多媒体标识。 图 5为本公开实施例提供的又一种信息处理方法的流程示意图。 如图 5所示, 本实 施例的方法包括:
S501: 对每个待选多媒体标识进行分词处理, 得到所述待选多媒体标识对应的多个 词语。 本实施 例中, 可以采用分词算法对每个待选多媒体标识进行分词处理, 得到该待选 多媒体标识对应的多个词语。 为 了便于理解, 下面以歌单名为例, 结合图 6 对根据待选多媒体标识确定目标多媒 体标识的过程进行举例说明。 图 6为本公开实施例提供的目标歌单名的确定过程的示意图。 如图 6所示, 假设经 过图 4所示的实施例, 确定出的 3个待选歌单名, 分别为: “海边的曼彻斯特”、 “傍晚的 咖啡厅”、 “忧伤的 90年代”。 继续参见 图 6,对待选歌单名 “海边的曼彻斯特 ”进行分词处理之后,得到两个词语, 分别为: 海边的、 曼彻斯特。 对待选歌单名 “傍晚的咖啡厅”进行分词处理之后, 得到 两个词语, 分别为: 傍晚的、 咖啡厅。 对待选歌单名 “忧伤的 90年代”进行分词处理之 后, 得到两个词语, 分别为: 忧伤的、 90年代。
S502: 对各待选多媒体标识对应的多个词语进行组合处理, 得到多个重组多媒体标 识。 本实施 例中, 每个待选多媒体标识经过分词处理, 得到多个词语。 通过对不同待选 多媒体标识之间的词语进行重组, 可以得到多个重组多媒体标识。 继续参见 图 6, 对分词之后得到的多个词语 (海边的、 曼彻斯特、 傍晚的、 咖啡厅、 忧伤的、 90年代) 进行组合处理, 得到多个重组歌单名。 例如: 海边的曼彻斯特、 傍晚 的曼彻斯特、 忧伤的曼彻斯特、 海边的咖啡厅、 傍晚的咖啡厅、 忧伤的咖啡厅、 海边的 90年代、 傍晚的 90年代、 忧伤的 90年代。 能够理解, 本实施例中, 通过对各待选多媒体标识对应的多个词语进行组合处理, 能够生成与第一多媒体信 息集合对应的多媒体特征一致的、 且语义上更加丰富多样的重 组多媒体标识。
S503: 对所述多个重组多媒体标识进行修正处理, 得到多个修正多媒体标识。 应 理解, 经过上述重组之后得到的重组多媒体标识可能不满足多媒体命名要求, 因 此, 可以对重组多媒体标识进行修正处理, 使得得到的修正多媒体标识满足多媒体命名 要求。 一些可能的实现方式中, 可以对每个重组多媒体标识进行如下至少一种处理, 得到 修正多媒体标识: 处理方式一: 删除重组多媒体标识中的第一预设词语。 其中, 第一预设词语为根据多媒体命名要求, 多媒体标识中禁用的词汇, 包括但不 限于: 不文明词语、 种族歧视词语等。 可选的, 可以通过预先训练好的识别模型, 对重组多媒体标识进行处理, 以删除重 组多媒体标识中第一预设 词语。 例如, 将重组多媒体标识输入识别模型, 识别模型检测 重组多媒体标识中是否存在 第一预设词语, 若存在则删除, 并输出删除之后的多媒体标 识。 一个示例中, 上述的识别模型可以采用基于变换器的双向编码器表示 (Bidirectional Encoder Representations from Transformer, BERT ) 模型。 处理方式二: 对重组多媒体标识中预设类型的词语进行替换处理, 所述预设类型包 括人名和 /或地名。 结合图 6进行举例说明, 重组歌单名 “海边的曼彻斯特”含有地名 “曼彻斯特”, 可 以根据该地名对应的位置和特点, 对该地名进行替换处理, 例如替换为 “西方小镇”, 这 样得到的修正歌单为 “海边的西方小镇”。 类 似的, 若重组多媒体标识中含有人名, 则可以采用类似的方式, 对人名进行替换 处理, 例如, 将人名替换为 “男孩”、 “女孩”、 “女士”等。 可选的, 可以通过预先训练得到替换模型, 对重组多媒体标识中预设类型的词语进 行替换处理。 例如, 将重组多媒体标识输入替换模型, 替换模型检测重组多媒体标识中 是否含有地名、 人名等预设词语, 若含有, 则对预设词语进行相应的替换, 并输出替换 之后的多媒体标识。 一个示例中, 上述的替换模型可以采用 BERT 模型。 对地名和人名的替换过程可以 采用同一替换模型, 也可以采用不同的替换模型, 本实施例对此不作限定。 处理方式三: 对重组多媒体标识中不符合语法的词语进行更新处理。 本 实施例中, 不符合语法的词语包括但不限于: 搭配不合理的词语、 文本不流畅的 词语等。 例如, 若重组多媒体标识中包括 “一支苹果”, 也存在搭配不合理的情况, 可以 更新为 “一个苹果 ”。 例如, 若重组多媒体标识中包括 “一只一只企鹅”, 则存在文本流 畅的情况, 可以更新为 “一只企鹅”。 继续参见 图 6, 重组歌单名 “傍晚的 90年代”、 “海边的 90年代”存在搭配不合理的 情况, 可以更新为 “美好的 90年代”、 “安静的 90年代”等。 可选 的, 可以通过预先训练得到更新模型, 对重组多媒体标识中不符合语法的词语 进行更新处理。 例如, 将重组多媒体标识输入更新模型, 更新模型检测重组多媒体标识 中是否含有不符合语法 的词语, 若含有, 则对不符合语法的词语进行相应的更新, 并输 出更新之后的多媒体标识。 一个示例中, 上述的替换模型可以采用 BERT模型。 处理方式 四: 对所述重组多媒体标识中的词语进行同义替换处理。 结合 图 6进行举例说明, 针对重组多媒体标识 “海边的咖啡厅”经过同义替换处理, 可以得到 “海边的咖啡馆”。 针对重组多媒体标识 “忧伤的 90年代”经过同义替换处理, 可以得到 “忧伤的 90后”、 “悲伤的 90年代”、 “悲伤的 90后”等。 需要说明的是, 图 6 中示例的修正歌单名仅为一些示例, 本实施例对此并不做限定。 应理解 , 经过同义替换处理, 又进一步的增加了重组多媒体标识的数量, 使得重组 多媒体标识更加丰富。 处理方式五 : 删除字符数量小于或等于预设阈值的重组多媒体标识。 能够理解 ,当重组多媒体标识中含有的字符数量较少时,例如字符数量小于或等于 4, 通常很难表达出完整的语义信 息, 因此, 本实施例中, 当重组多媒体标识中的字符数量 小于或者等于预设阈值时, 可以删除该重组多媒体标识。 需要说明的是, 实际应用中, 针对每个重组多媒体标识, 可以采用上述 5 种处理方 式中的一种或者多种进行处理 , 得到一个或者多个修正多媒体标识。 当采用多种处理方 式时, 多种处理方式的顺序不做限定。
S504: 在所述多个修正多媒体标识中确定所述目标多媒体标识。 本实施 例中, 可以在多个参考多媒体标识中确定目标参考多媒体标识, 所述目标参 考多媒体标识对应的多媒体特 征与所述第一多媒体信息集合对应的多媒体特征之间的匹 配度最高。 可选的, 可以根据各参考多媒体标识对应的参考标签集合与第一标签集合确 定上述相似度。 示例性, 结合图 4所示进行举例说明, 图 4中, 由于参考标签集合 4与 第一标签集合相同, 说明, 参考歌单 4 与待命名歌单的特征匹配度最高, 因此, 可以将 参考歌单名 4作为目标参考多媒体标识。 进一 步的, 获取每个修正多媒体标识与所述目标参考多媒体标识之间的相似度; 根 据各修正多媒体标识与所述 目标参考多媒体标识之间的相似度, 在所述多个修正多媒体 标识中确定所述目标多媒体标识。 一个示 例中, 将多个修正多媒体标识中, 与目标参考多媒体标识之间的相似度最高 的修正多媒体标识, 确定为目标多媒体标识。 该示例中, 确定出的目标多媒体标识的数 量为 1 = 另一个示 例中, 按照各修正多媒体标识与所述目标参考多媒体标识之间的相似度由 高到低的顺序, 对多个修正多媒体标识进行排序处理, 将排序后的前 M个修正多媒体标 识确定为目标多媒体标识。 该示例中, 确定出的目标多媒体标识的数量为 M, M为大于 或者等于 1的整数。 本实施 例中, 通过对多个待选多媒体标识中的词语进行组合处理, 得到多个重组多 媒体标识, 能够生成与第一多媒体信息集合对应的多媒体特征一致的、 且语义上更加丰 富多样的重组多媒体标识 。 进而, 对多个重组多媒体标识进行修正处理, 得到多个修正 多媒体标识, 并在多个修正多媒体标识中确定目标多媒体标识, 保证了确定出的目标多 媒体标识满足多媒体命名要求, 提高了目标多媒体标识的质量。 图 7为本公开实施例提供的一种信息处理过程的示意图。 如图 7所示, 以歌单为例, 本实施例的信息处理过程包括:
( 1 ) 根据待命名歌单, 确定第一歌单特征, 第一歌单特征可以包括曲风、 情感、 曲 调等多个维度的特征。 其 中, 对待命名歌单进行特征提取的过程可以参见图 2所示实施例的描述。
(2) 根据第一歌单特征, 从歌单库存储的多个参考歌单名中确定出至少一个待选歌 单名。 其 中, 待选歌单名对应的参考歌单特征与第一歌单特征之间的匹配度满足预设条件。 从歌单库中确定至少一个待选歌单名的过程可以参见图 3或图 4所示实施例的详细描述。
( 3 ) 对至少一个待选歌单名中的词语进行组合处理, 得到多个重组歌单名。
(4) 对多个重组歌单名进行修正处理, 得到多个修正歌单名。
( 5 ) 在多个修正歌单名中确定出目标歌单名。 其 中, 对至少一个待选歌单名中的词语进行组合处理、 修正处理、 以及确定目标歌 单名的过程, 可以参见图 5所示实施例的详细描述。 图 8为本公开实施例提供的一种信息处理装置的结构示意图。 该装置可以为软件和/ 或硬件的形式。 该装置可以为终端设备 /服务器, 或者为集成到终端设备 /服务器中的处理 器、 芯片、 芯片模组、 模块、 单元、 应用程序等。 如 图 8所示, 本实施例提供的信息处理装置 800, 包括: 第一获取模块 801、 第二获 取模块 802、 第一确定模块 803和第二确定模块 804。 其 中, 第一获取模块 801 , 用于获取待处理的第一多媒体信息集合, 所述第一多媒体 信息集合中包括多个第一多媒体信息; 第二获取模块 802, 用于获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一个参考多媒体标识用于指示 一个参考多媒体信息集合, 一个参考多媒体信息集合中包 括多个参考多媒体信息; 第一确定模块 803 , 用于根据所述第一多媒体信息集合, 在所述多个参考多媒体标识 中, 确定出至少一个待选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集 合对应的多媒体特征与所述第 一多媒体信息集合对应的多媒体特征之间的匹配度满足预 设条件; 第二确定模块 804, 用于根据所述至少一个待选多媒体标识, 确定所述第一多媒体信 息集合对应的目标多媒体标识。 一种可 能的实现方式中, 第一确定模块 803具体用于: 根据所 述第一多媒体信息集合对应的多媒体特征, 确定第一标签集合, 所述第一标 签集合中包括至少一个特征标签; 根据每 个参考多媒体标识所指示的参考多媒体信息集合对应的多媒体特 征, 确定该 参考多媒体标识对应的参考标签集合, 所述参考标签集合中包括至少一个特征标签; 根据所 述第一标签集合以及各参考多媒体标识对应的参考标签集合 , 在所述多个参 考多媒体标识中确定所述至少一个待选多媒体标识。 一种可 能的实现方式中, 第一确定模块 803具体用于: 根据 各参考多媒体标识对应的参考标签集合, 确定多个参考特征标签, 所述多个参 考特征标签中不存在重复的特征标签; 根据 各参考多媒体标识、 以及各参考多媒体标识对应的参考标签集合, 确定每个参 考特征标签对应的参考多媒体标识集合; 根据所 述第一标签集合和每个参考特征标签对应的参考多媒体标识集合 , 在所述多 个参考多媒体标识中确定所述至少一个待选多媒体标识。 一种可 能的实现方式中, 第一确定模块 803具体用于: 根据所 述第一标签集合, 在所述多个参考特征标签中确定至少一个目标特征标签, 所述目标特征标签属于所述第一标签集合; 根据所 述至少一个目标特征标签对应的参考多媒体标识集合, 确定所述至少一个待 选多媒体标识。 一种可 能的实现方式中, 第二确定模块 804具体用于: 对每个待选 多媒体标识进行分词处理, 得到所述待选多媒体标识对应的多个词语; 对各待选 多媒体标识对应的多个词语进行组合处理, 得到多个重组多媒体标识; 对所述 多个重组多媒体标识进行修正处理, 得到多个修正多媒体标识; 在所述 多个修正多媒体标识中确定所述目标多媒体标识。 一种可 能的实现方式中, 针对任意一个重组多媒体标识, 第二确定模块 804 具体用 于: 对所述重组 多媒体标识进行如下至少一种处理, 得到所述修正多媒体标识: 删 除所述重组多媒体标识中的第一预设词语; 对所述 重组多媒体标识中预设类型的词语进行替换处理, 所述预设类型包括人名和 / 或地名; 对所述重组 多媒体标识中不符合语法的词语进行更新处理; 对所述重组 多媒体标识中的词语进行同义替换处理; 删 除字符数量小于或等于预设阈值的重组多媒体标识。 一种可 能的实现方式中, 第二确定模块 804具体用于: 在所述 多个参考多媒体标识中确定目标参考多媒体标识, 所述目标参考多媒体标识 对应的参考 多媒体特征与所述第一多媒体 信息集合对应的多媒体特征之 间的匹配度最 局 ; 获取每个修正 多媒体标识与所述目标参考多媒体标识之间的相似度; 根据 各修正多媒体标识与所述目标参考多媒体标识之间的相似度 , 在所述多个修正 多媒体标识中确定所述目标多媒体标识。 一种可 能的实现方式中, 第二确定模块 804具体用于: 按照 各修正多媒体标识与所述目标参考多媒体标识之间的相似度 由高到低的顺序, 对所述多个修正多媒体标识进行排序处理; 将排 序后的前 M个修正多媒体标识确定为所述目标多媒体标识,所述 M为大于或者 等于 1的整数。 一种可能的实现方式中, 所述第一多媒体信息为如下任意一种: 音频、 文本、 图像 或视频。 一种可能的实现方式中, 所述第一多媒体信息为歌曲, 所述多媒体特征包括曲风、 情感、 曲种中的一个或者多个维度的特征。 一种可能的实现方式中, 本实施例的装置还包括: 设置模块, 用于将所述第一多媒体信息集合的标识设置为所述目标多媒体标识; 或 者, 显示模块, 用于显示所述目标多媒体标识; 或者, 发送模块, 用于向预设设备发送所述目标多媒体标识。 本 实施例提供的信息处理装置, 可用于执行上述任一方法实施例中的信息处理方法, 其实现原理和技术效果类似, 此处不作赘述。 为 了实现上述实施例, 本公开实施例还提供了一种电子设备。 参考 图 9, 其示出了适于用来实现本公开实施例的电子设备 900的结构示意图, 该电 子设备 900可以为终端设备或服务器。 其中, 终端设备可以包括但不限于诸如移动电话、 笔记本电脑、 数字广播接收器、 个人数字助理 (Personal Digital Assistant, 简称 PDA)、 平板电脑 (Portable Android Device, 简称 PAD)、 便携式多媒体播放器 (Portable Media Player, 简称 PMP)、 车载终端 (例如车载导航终端) 等等的移动终端以及诸如数字电视 机 ( Television, TV)、 台式计算机等等的固定终端。 图 9示出的电子设备仅仅是一个示 例, 不应对本公开实施例的功能和使用范围带来任何限制。 如图 9所示, 电子设备 900可以包括处理装置 (例如中央处理器、 图形处理器等) 901 , 其可以根据存储在只读存储器 ( Read Only Memory, 简称 ROM) 902中的程序或者 从存储装置 908加载到随机访问存储器 (Random Access Memory, 简称 RAM) 903中的 程序而执行各种适当的动作和处理。 在 RAM 903中, 还存储有电子设备 900操作所需的 各种程序和数据。 处理装置 901、 ROM 902以及 RAM 903通过总线 904彼此相连。 输入 /输出 (Input/Output, I/O) 接口 905也连接至总线 904。 通 常, 以下装置可以连接至 I/O接口 905: 包括例如触摸屏、 触摸板、 键盘、 鼠标、 摄像头、麦克风、加速度计、陀螺仪等的输入装置 906;包括例如液晶显示器 (Liquid Crystal Display, 简称 LCD)、 扬声器、 振动器等的输出装置 907; 包括例如磁带、 硬盘等的存储 装置 908; 以及通信装置 909。 通信装置 909可以允许电子设备 900与其他设备进行无线 或有线通信以交换数据。虽然图 9示出了具有各种装置的电子设备 900,但是应理解的是, 并不要求实施或具备所有示出的装置。 可以替代地实施或具备更多或更少的装置。 特 别地, 根据本公开的实施例, 上文参考流程图描述的过程可以被实现为计算机软 件程序。 例如, 本公开的实施例包括一种计算机程序产品, 其包括承载在计算机可读介 质上的计算机程序 , 该计算机程序包含用于执行流程图所示的方法的程序代码。 在这样 的实施例中, 该计算机程序可以通过通信装置 909 从网络上被下载和安装, 或者从存储 装置 908被安装, 或者从 ROM 902被安装。 在该计算机程序被处理装置 901执行时, 执 行本公开实施例的方法中限定的上述功能 。 需要说明的是, 本公开上述的计算机可读介质可以是计算机可读信号介质或者计算 机可读存储介质或者是上述两者 的任意组合。 计算机可读存储介质例如可以是一一但不 限于一一电、 磁、 光、 电磁、 红外线、 或半导体的系统、 装置或器件, 或者任意以上的 组合。 计算机可读存储介质的更具体的例子可以包括但不限于: 具有一个或多个导线的 电连接、 便携式计算机磁盘、 硬盘、 随机访问存储器 (RAM)、 只读存储器 (ROM)、 可 擦式可编程只读存储器 (Erasable Programmable Read Only Memory, EPROM或闪存)、 光纤、 便携式紧凑磁盘只读存储器 ( Compact Disk Read Only Memory , CD-ROM 光存 储器件、 磁存储器件、 或者上述的任意合适的组合。 在本公开中, 计算机可读存储介质 可以是任何包含或存储程序 的有形介质, 该程序可以被指令执行系统、 装置或者器件使 用或者与其结合使用 。 而在本公开中, 计算机可读信号介质可以包括在基带中或者作为 载波一部分传播的数据信号 , 其中承载了计算机可读的程序代码。 这种传播的数据信号 可以采用多种形式, 包括但不限于电磁信号、 光信号或上述的任意合适的组合。 计算机 可读信号介质还可以是计算机 可读存储介质以外的任何计算机可读介质, 该计算机可读 信号介质可以发送、 传播或者传输用于由指令执行系统、 装置或者器件使用或者与其结 合使用的程序。 计算机可读介质上包含的程序代码可以用任何适当的介质传输, 包括但 不限于: 电线、 光缆、 射频 (Radio Frequency, RF) 等等, 或者上述的任意合适的组合。 上述计 算机可读介质可以是上述电子设备中所包含的; 也可以是单独存在, 而未装 配入该电子设备中。 上述计 算机可读介质承载有一个或者多个程序, 当上述一个或者多个程序被该电子 设备执行时, 使得该电子设备执行上述实施例所示的方法。 可 以以一种或多种程序设计语言或其组合来编写用于执行本公开 的操作的计算机程 序代码, 上述程序设计语言包括面向对象的程序设计语言一诸如 Java、 Smalltalk, C++, 还包括常规的过程式程序设计语言一诸如 “ C”语言或类似的程序设计语言。 程序代码可 以完全地在用户计算机上执行 、 部分地在用户计算机上执行、 作为一个独立的软件包执 行、 部分在用户计算机上部分在远程计算机上执行、 或者完全在远程计算机或服务器上 执行。 在涉及远程计算机的情形中, 远程计算机可以通过任意种类的网络一一包括局域 网 (Local Area Network, 简称 LAN) 或广域网 (Wide Area Network, 简称 WAN) 一连 接到用户计算机, 或者, 可以连接到外部计算机 (例如利用因特网服务提供商来通过因 特网连接)。 附图中的流程图和框图, 图示了按照本公开各种实施例的系统、 方法和计算机程序 产品的可能实现的体系架构、 功能和操作。 在这点上, 流程图或框图中的每个方框可以 代表一个模块、 程序段、 或代码的一部分, 该模块、 程序段、 或代码的一部分包含一个 或多个用于实现规定的逻辑功能的可执行指令。 也应当注意, 在有些作为替换的实现中, 方框中所标注的功能也可 以以不同于附图中所标注的顺序发生。 例如, 两个接连地表示 的方框实际上可以基本并行地执行 , 它们有时也可以按相反的顺序执行, 这依所涉及的 功能而定。 也要注意的是, 框图和 /或流程图中的每个方框、 以及框图和 /或流程图中的方 框的组合, 可以用执行规定的功能或操作的专用的基于硬件的系统来实现, 或者可以用 专用硬件与计算机指令的组合来实现。 描述于本公开实施例中所涉及到的单元可以通过软件的方式实现 , 也可以通过硬件 的方式来实现。 其中, 单元的名称在某种情况下并不构成对该单元本身的限定, 例如, 第一获取单元还可以被描述为 “获取至少两个网际协议地址的单元”。 本 文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来 执行。 例如, 非限制 性地, 可以使用的示范类型的硬件逻 辑部件包括: 现场可编程门阵列 ( Field Programmable Gate Array, FPGA)、专用集成电路 (Application Specific Integrated Circuit, ASIC )、 专用标准产品 ( Application Specific Standard Product , ASSP )、 片上系统 ( System-on-chip, SOC)、 复杂可编程逻辑设备 (Complex Programmable Logic Device, CPLD) 等等。 在 本公开的上下文中, 机器可读介质可以是有形的介质, 其可以包含或存储以供指 令执行系统、 装置或设备使用或与指令执行系统、 装置或设备结合地使用的程序。 机器 可读介质可以是机器可读信 号介质或机器可读储存介质。 机器可读介质可以包括但不限 于电子的、 磁性的、 光学的、 电磁的、 红外的、 或半导体系统、 装置或设备, 或者上述 内容的任何合适组合 。 机器可读存储介质的更具体示例会包括基于一个或多个线的电气 连接、 便携式计算机盘、 硬盘、 随机存取存储器 (RAM)、 只读存储器 (ROM)、 可擦除 可编程只读存储器 (EPROM或快 闪存储器)、光纤、便捷式紧凑盘只读存储器 ( CD-ROM), 光学储存设备、 磁储存设备、 或上述内容的任何合适组合。 第 一方面, 根据本公开的一个或多个实施例, 提供了一种信息处理方法, 包括: 获取待处理的第一多媒体信息集合, 所述第一多媒体信息集合中包括多个第一多媒 体信息; 获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一个参考多媒体标识用 于指示一个参考多媒体信息集合, 一个参考多媒体信息集合中包括多个参考多媒体信息; 根 据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待 选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集合对应的多媒体特征与 所述第一多媒体信息集合对应的多媒体特征之间 的匹配度满足预设条件; 根 据所述至少一个待选多媒体标识, 确定所述第一多媒体信息集合对应的目标多媒 体标识。 根 据本公开的一个或多个实施例, 根据所述第一多媒体信息集合, 在所述多个参考 多媒体标识中, 确定出至少一个待选多媒体标识, 包括: 根 据所述第一多媒体信息集合对应的所述多媒体特征, 确定第一标签集合, 所述第 一标签集合中包括至少一个特征标签; 根 据每个参考多媒体标识所指示的参考多媒体信息集合对应 的多媒体特征, 确定该 参考多媒体标识对应的参考标签集合, 所述参考标签集合中包括至少一个特征标签; 根 据所述第一标签集合以及各参考多媒体标识对应的参考标签集合 , 在所述多个参 考多媒体标识中确定所述至少一个待选多媒体标识。 根 据本公开的一个或多个实施例, 根据所述第一标签集合以及各参考多媒体标识对 应的参考标签集合 , 在所述多个参考多媒体标识中确定所述至少一个待选多媒体标识, 包括: 根据所 述各参考多媒体标识对应的所述参考标签集合, 确定多个参考特征标签, 所 述多个参考特征标签中不存在重复的特征标签; 根据所述各参考 多媒体标识、 以及所述各参考多媒体标识对应的所述参考标签集合, 确定每个参考特征标签对应的参考多媒体标识集合; 根据所 述第一标签集合和每个参考特征标签对应的参考多媒体标识集合 , 在所述多 个参考多媒体标识中确定所述至少一个待选多媒体标识。 根据本 公开的一个或多个实施例, 根据所述第一标签集合和每个参考特征标签对应 的参考多媒体标识集合 , 在所述多个参考多媒体标识中确定所述至少一个待选多媒体标 识, 包括: 根据所 述第一标签集合, 在所述多个参考特征标签中确定至少一个目标特征标签, 所述目标特征标签属于所述第一标签集合; 根据所 述至少一个目标特征标签对应的参考多媒体标识集合, 确定所述至少一个待 选多媒体标识。 根据本 公开的一个或多个实施例, 根据所述至少一个待选多媒体标识, 确定所述第 一多媒体信息集合对应的目标多媒体标识, 包括: 对每个待选 多媒体标识进行分词处理, 得到所述待选多媒体标识对应的多个词语; 对各待选 多媒体标识对应的多个词语进行组合处理, 得到多个重组多媒体标识; 对所述 多个重组多媒体标识进行修正处理, 得到多个修正多媒体标识; 在所述 多个修正多媒体标识中确定所述目标多媒体标识。 根据本 公开的一个或多个实施例, 针对任意一个重组多媒体标识, 对所述重组多媒 体标识进行修正处理, 得到所述修正多媒体标识, 包括: 对所述重组 多媒体标识进行如下至少一种处理, 得到所述修正多媒体标识: 删 除所述重组多媒体标识中的第一预设词语; 对所述 重组多媒体标识中预设类型的词语进行替换处理, 所述预设类型包括人名和 / 或地名; 对所述重组 多媒体标识中不符合语法的词语进行更新处理; 对所述重组 多媒体标识中的词语进行同义替换处理; 删 除字符数量小于或等于预设阈值的重组多媒体标识。 根据本 公开的一个或多个实施例, 在所述多个修正多媒体标识中确定所述目标多媒 体标识, 包括: 在所述 多个参考多媒体标识中确定目标参考多媒体标识, 所述目标参考多媒体标识 对应的多媒体 特征与所述第一多媒体信息 集合对应的所述多媒体特征之 间的匹配度最 局; 获取每个修正 多媒体标识与所述目标参考多媒体标识之间的相似度; 根据 各修正多媒体标识与所述目标参考多媒体标识之间的相似度 , 在所述多个修正 多媒体标识中确定所述目标多媒体标识。 根据本 公开的一个或多个实施例, 根据各修正多媒体标识与所述目标参考多媒体标 识之间的相似度, 在所述多个修正多媒体标识中确定所述目标多媒体标识, 包括: 按照所 述各修正多媒体标识与所述目标参考多媒体标识之间的相似度 由高到低的顺 序, 对所述多个修正多媒体标识进行排序处理; 将排序后 的前 M个修正多媒体标识确定为所述目标多媒体标识,所述 M为大于或者 等于 1的整数。 根据本 公开的一个或多个实施例, 所述第一多媒体信息为如下任意一种: 音频、 文 本、 图像或视频。 根据本 公开的一个或多个实施例, 所述第一多媒体信息为歌曲, 所述多媒体特征包 括曲风、 情感、 曲种中的一个或者多个维度的特征。 根据本 公开的一个或多个实施例, 根据所述至少一个待选多媒体标识, 确定所述第 一多媒体信息集合对应的目标多媒体标识之后, 还包括: 将所述第一 多媒体信息集合的标识设置为所述目标多媒体标识; 或者, 显示所述 目标多媒体标识; 或者, 向预设设备发送所述目标多媒体标识。 第二方面 , 根据本公开的一个或多个实施例, 提供了一种信息处理装置, 包括: 第一 获取模块, 用于获取待处理的第一多媒体信息集合, 所述第一多媒体信息集合 中包括多个第一多媒体信息; 第二 获取模块, 用于获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一 个参考多媒体标识用于指示一个 参考多媒体信息集合, 一个参考多媒体信息集合中包括 多个参考多媒体信息; 第一确定模块 , 用于根据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待选多媒体标识 , 所述待选多媒体标识所指示的参考多媒体信息集合对 应的多媒体特征与所述第一 多媒体信息集合对应的多媒体特征之间的匹配度满足预设条 件; 第二确 定模块, 用于根据所述至少一个待选多媒体标识, 确定所述第一多媒体信息 集合对应的目标多媒体标识。 根据本公开 的一个或多个实施例, 第一确定模块具体用于: 根据所 述第一多媒体信息集合对应的所述多媒体特征, 确定第一标签集合, 所述第 一标签集合中包括至少一个特征标签; 根据每 个参考多媒体标识所指示的参考多媒体信息集合对应的多媒体特 征, 确定该 参考多媒体标识对应的参考标签集合, 所述参考标签集合中包括至少一个特征标签; 根据所 述第一标签集合以及各参考多媒体标识对应的参考标签集合 , 在所述多个参 考多媒体标识中确定所述至少一个待选多媒体标识。 根据本公开 的一个或多个实施例, 第一确定模块具体用于: 根据所 述各参考多媒体标识对应的所述参考标签集合, 确定多个参考特征标签, 所 述多个参考特征标签中不存在重复的特征标签; 根据所述各参考 多媒体标识、 以及所述各参考多媒体标识对应的所述参考标签集合, 确定每个参考特征标签对应的参考多媒体标识集合; 根据所 述第一标签集合和每个参考特征标签对应的参考多媒体标识集合 , 在所述多 个参考多媒体标识中确定所述至少一个待选多媒体标识。 根据本公开 的一个或多个实施例, 第一确定模块具体用于: 根据所 述第一标签集合, 在所述多个参考特征标签中确定至少一个目标特征标签, 所述目标特征标签属于所述第一标签集合; 根据所 述至少一个目标特征标签对应的参考多媒体标识集合, 确定所述至少一个待 选多媒体标识。 根据本公开 的一个或多个实施例, 第二确定模块具体用于: 对每个待选 多媒体标识进行分词处理, 得到所述待选多媒体标识对应的多个词语; 对各待选 多媒体标识对应的多个词语进行组合处理, 得到多个重组多媒体标识; 对所述 多个重组多媒体标识进行修正处理, 得到多个修正多媒体标识; 在所述 多个修正多媒体标识中确定所述目标多媒体标识。 根据本 公开的一个或多个实施例, 针对任意一个重组多媒体标识, 第二确定模块具 体用于: 对所述重组 多媒体标识进行如下至少一种处理, 得到所述修正多媒体标识: 删 除所述重组多媒体标识中的第一预设词语; 对所述 重组多媒体标识中预设类型的词语进行替换处理, 所述预设类型包括人名和 / 或地名; 对所述重组 多媒体标识中不符合语法的词语进行更新处理; 对所述重组 多媒体标识中的词语进行同义替换处理; 删 除字符数量小于或等于预设阈值的重组多媒体标识。 根据本公开 的一个或多个实施例, 第二确定模块具体用于: 在所述 多个参考多媒体标识中确定目标参考多媒体标识, 所述目标参考多媒体标识 对应的参考多媒体特征与所述第 一多媒体信息集合对应的所述多媒体特征之间的匹配度 最局; 获取每个修正 多媒体标识与所述目标参考多媒体标识之间的相似度; 根据 各修正多媒体标识与所述目标参考多媒体标识之间的相似度 , 在所述多个修正 多媒体标识中确定所述目标多媒体标识。 根据本公开 的一个或多个实施例, 第二确定模块具体用于: 按照所 述各修正多媒体标识与所述目标参考多媒体标识之间的相似度 由高到低的顺 序, 对所述多个修正多媒体标识进行排序处理; 将排序后 的前 M个修正多媒体标识确定为所述目标多媒体标识,所述 M为大于或者 等于 1的整数。 根据本 公开的一个或多个实施例, 所述第一多媒体信息为如下任意一种: 音频、 文 本、 图像或视频。 根据本 公开的一个或多个实施例, 所述第一多媒体信息为歌曲, 所述多媒体特征包 括曲风、 情感、 曲种中的一个或者多个维度的特征。 根据本公开 的一个或多个实施例, 信息处理装置还包括: 设置模 块, 用于将所述第一多媒体信息集合的标识设置为所述目标多媒体标识; 或 者, 显示模块 , 用于显示所述目标多媒体标识; 或者, 发送模块 , 用于向预设设备发送所述目标多媒体标识。 第三 方面, 根据本公开的一个或多个实施例, 提供了一种电子设备, 包括: 至少一 个处理器和存储器; 所述存储器存储计 算机执行指令; 所述 至少一个处理器执行所述存储器存储的所述计算机执行指令 , 使得所述至少一 个处理器执行如上第一方面以及第一方面各种可能的实现方式所述 的信息处理方法。 第 四方面, 根据本公开的一个或多个实施例, 提供了一种计算机可读存储介质, 所 述计算机可读存储介质中存储有计算机执行指令, 当处理器执行所述计算机执行指令时, 实现如上第一方面以及第一方面各种可能的实现方式所述的信息处理方法 。 第五 方面, 根据本公开的一个或多个实施例, 提供了一种计算机程序产品, 包括计 算机程序, 所述计算机程序被处理器执行时实现如第一方面以及第一方面各种可能的实 现方式所述的信息处理方法。 第六 方面, 根据本公开的一个或多个实施例, 提供了一种计算机程序, 所述计算机 程序被处理器执行时实现如第 一方面以及第一方面各种可能的实现方式所述的信息处理 方法。 以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。 本领域技术人员 应当理解, 本公开中所涉及的公开范围, 并不限于上述技术特征的特定组合而成的技术 方案, 同时也应涵盖在不脱离上述公开构思的情况下, 由上述技术特征或其等同特征进 行任意组合而形成的其它技术 方案。 例如上述特征与本公开中公开的 (但不限于) 具有 类似功能的技术特征进行互相替换而形成的技术方案 。 此外 , 虽然采用特定次序描绘了各操作, 但是这不应当理解为要求这些操作以所示 出的特定次序或以顺序次序来执 行。 在一定环境下, 多任务和并行处理可能是有利的。 同样地, 虽然在上面论述中包含了若干具体实现细节, 但是这些不应当被解释为对本公 开的范围的限制。 在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个 实施例中。 相反地, 在单个实施例的上下文中描述的各种特征也可以单独地或以任何合 适的子组合的方式实现在多个实施例中。 尽管 巳经采用特定于结构特征和 /或方法逻辑动作的语言描述了本主题, 但是应当理 解所附权利要求书中所限定 的主题未必局限于上面描述的特定特征或动作。 相反, 上面 所描述的特定特征和动作仅仅是实现权利要求书的示例形式 。

Claims

权 利 要 求 书
1、 一种信息处理方法, 包括: 获取 待处理的第一多媒体信息集合, 所述第一多媒体信息集合中包括多个第一多媒 体信息; 获取参 考信息, 所述参考信息中包括多个参考多媒体标识, 一个参考多媒体标识用 于指示一个参考多媒体信息集合, 一个参考多媒体信息集合中包括多个参考多媒体信息; 根据所 述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待 选多媒体标识, 所述待选多媒体标识所指示的参考多媒体信息集合对应的多媒体特征与 所述第一多媒体信息集合对应的多媒体特征之间的匹配度满足预设条件 ; 根据所 述至少一个待选多媒体标识, 确定所述第一多媒体信息集合对应的目标多媒 体标识。
2、 根据权利要求 1所述的方法, 其中, 根据所述第一多媒体信息集合, 在所述多个 参考多媒体标识中, 确定出至少一个待选多媒体标识, 包括: 根据所 述第一多媒体信息集合对应的所述多媒体特征, 确定第一标签集合, 所述第 一标签集合中包括至少一个特征标签; 根据每 个参考多媒体标识所指示的参考多媒体信息集合对应的多媒体特 征, 确定该 参考多媒体标识对应的参考标签集合, 所述参考标签集合中包括至少一个特征标签; 根据所 述第一标签集合以及各参考多媒体标识对应的参考标签集合 , 在所述多个参 考多媒体标识中确定所述至少一个待选多媒体标识。
3、 根据权利要求 2所述的方法, 其中, 根据所述第一标签集合以及各参考多媒体标 识对应的参考标签集合 , 在所述多个参考多媒体标识中确定所述至少一个待选多媒体标 识, 包括: 根据所 述各参考多媒体标识对应的所述参考标签集合, 确定多个参考特征标签, 所 述多个参考特征标签中不存在重复的特征标签; 根据所述各参考 多媒体标识、 以及所述各参考多媒体标识对应的所述参考标签集合, 确定每个参考特征标签对应的参考多媒体标识集合; 根据所 述第一标签集合和每个参考特征标签对应的参考多媒体标识集合 , 在所述多 个参考多媒体标识中确定所述至少一个待选多媒体标识。
4、 根据权利要求 3所述的方法, 其中, 根据所述第一标签集合和每个参考特征标签 对应的参考多媒体标识集合 , 在所述多个参考多媒体标识中确定所述至少一个待选多媒 体标识, 包括: 根据所 述第一标签集合, 在所述多个参考特征标签中确定至少一个目标特征标签, 所述目标特征标签属于所述第一标签集合; 根据所 述至少一个目标特征标签对应的参考多媒体标识集合, 确定所述至少一个待 选多媒体标识。
5、 根据权利要求 1至 4任一项所述的方法, 其中, 根据所述至少一个待选多媒体标 识, 确定所述第一多媒体信息集合对应的目标多媒体标识, 包括: 对每个待选 多媒体标识进行分词处理, 得到所述待选多媒体标识对应的多个词语; 对各待选 多媒体标识对应的多个词语进行组合处理, 得到多个重组多媒体标识; 对所述 多个重组多媒体标识进行修正处理, 得到多个修正多媒体标识; 在所述 多个修正多媒体标识中确定所述目标多媒体标识。
6、 根据权利要求 5所述的方法, 其中, 针对任意一个重组多媒体标识, 对所述重组 多媒体标识进行修正处理, 得到所述修正多媒体标识, 包括: 对所述重组 多媒体标识进行如下至少一种处理, 得到所述修正多媒体标识: 删 除所述重组多媒体标识中的第一预设词语; 对所述 重组多媒体标识中预设类型的词语进行替换处理, 所述预设类型包括人名和 / 或地名; 对所述重组 多媒体标识中不符合语法的词语进行更新处理; 对所述重组 多媒体标识中的词语进行同义替换处理; 删 除字符数量小于或等于预设阈值的重组多媒体标识。
7、 根据权利要求 5或 6所述的方法, 其中, 在所述多个修正多媒体标识中确定所述 目标多媒体标识, 包括: 在所述 多个参考多媒体标识中确定目标参考多媒体标识, 所述目标参考多媒体标识 对应的多媒体 特征与所述第一多媒体信息 集合对应的所述多媒体特征之 间的匹配度最 局 ; 获取每个修正 多媒体标识与所述目标参考多媒体标识之间的相似度; 根据 各修正多媒体标识与所述目标参考多媒体标识之间的相似度 , 在所述多个修正 多媒体标识中确定所述目标多媒体标识。
8、 根据权利要求 7所述的方法, 其中, 根据各修正多媒体标识与所述目标参考多媒 体标识之间的相似度, 在所述多个修正多媒体标识中确定所述目标多媒体标识, 包括: 按照所 述各修正多媒体标识与所述目标参考多媒体标识之间的相似度 由高到低的顺 序, 对所述多个修正多媒体标识进行排序处理; 将排序后 的前 M个修正多媒体标识确定为所述目标多媒体标识,所述 M为大于或者 等于 1的整数。
9、 根据权利要求 1至 8任一项所述的方法, 其中, 所述第一多媒体信息为如下任意 一种: 音频、 文本、 图像或视频。
10、 根据权利要求 1至 8任一项所述的方法, 其中, 所述第一多媒体信息为歌曲, 所述多媒体特征包括曲风、 情感、 曲种中的一个或者多个维度的特征。
11、 根据权利要求 1至 10任一项所述的方法, 其中, 根据所述至少一个待选多媒体 标识, 确定所述第一多媒体信息集合对应的目标多媒体标识之后, 还包括: 将所述第一 多媒体信息集合的标识设置为所述目标多媒体标识; 或者, 显示所述 目标多媒体标识; 或者, 向预设设备发送所述目标多媒体标识。
12、 一种信息处理装置, 包括: 第一 获取模块, 用于获取待处理的第一多媒体信息集合, 所述第一多媒体信息集合 中包括多个第一多媒体信息; 第二 获取模块, 用于获取参考信息, 所述参考信息中包括多个参考多媒体标识, 一 个参考多媒体标识用于指示一个 参考多媒体信息集合, 一个参考多媒体信息集合中包括 多个参考多媒体信息; 第一确定模块 , 用于根据所述第一多媒体信息集合, 在所述多个参考多媒体标识中, 确定出至少一个待选多媒体标识 , 所述待选多媒体标识所指示的参考多媒体信息集合对 应的多媒体特征与所述第一 多媒体信息集合对应的多媒体特征之间的匹配度满足预设条 件; 第二确 定模块, 用于根据所述至少一个待选多媒体标识, 确定所述第一多媒体信息 集合对应的目标多媒体标识。
13、 一种电子设备, 包括: 处理器和存储器; 所述存储器存储计 算机执行指令; 所述处理器执 行所述计算机执行指令, 实现如权利要求 1至 11任一项所述的方法。
14、 一种计算机可读存储介质, 其中, 所述计算机可读存储介质中存储有计算机执 行指令, 当处理器执行所述计算机执行指令时, 实现如权利要求 1至 11任一项所述的方 法。
15、 一种计算机程序产品, 包括计算机程序, 所述计算机程序被处理器执行时实现 如权利要求 1至 11任一项所述的方法。
16、 一种计算机程序, 所述计算机程序被处理器执行时实现如权利要求 1至 11任一 项所述的方法。
PCT/SG2023/050098 2022-02-21 2023-02-20 信息处理方法、装置、设备、存储介质及程序 WO2023158384A2 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210154951.9 2022-02-21
CN202210154951.9A CN116662584A (zh) 2022-02-21 2022-02-21 信息处理方法、装置、设备、存储介质及程序

Publications (2)

Publication Number Publication Date
WO2023158384A2 true WO2023158384A2 (zh) 2023-08-24
WO2023158384A3 WO2023158384A3 (zh) 2023-11-09

Family

ID=87579186

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/SG2023/050098 WO2023158384A2 (zh) 2022-02-21 2023-02-20 信息处理方法、装置、设备、存储介质及程序

Country Status (2)

Country Link
CN (1) CN116662584A (zh)
WO (1) WO2023158384A2 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7043477B2 (en) * 2002-10-16 2006-05-09 Microsoft Corporation Navigating media content via groups within a playlist
US20090150445A1 (en) * 2007-12-07 2009-06-11 Tilman Herberger System and method for efficient generation and management of similarity playlists on portable devices
CN112487236A (zh) * 2020-12-01 2021-03-12 腾讯音乐娱乐科技(深圳)有限公司 确定关联歌单的方法、装置、设备及存储介质
CN113282788B (zh) * 2021-05-27 2023-09-26 平安科技(深圳)有限公司 基于神经网络技术的视频配乐推荐方法、装置以及设备

Also Published As

Publication number Publication date
CN116662584A (zh) 2023-08-29
WO2023158384A3 (zh) 2023-11-09

Similar Documents

Publication Publication Date Title
CN107871500B (zh) 一种播放多媒体的方法和装置
CN107918653B (zh) 一种基于喜好反馈的智能播放方法和装置
WO2022042593A1 (zh) 字幕编辑方法、装置和电子设备
US20150248886A1 (en) Model Based Approach for On-Screen Item Selection and Disambiguation
US20140325408A1 (en) Apparatus and method for providing musical content based on graphical user inputs
US20140244600A1 (en) Managing duplicate media items
CN108604233B (zh) 用于个性化即时查询建议的媒体消费场境
WO2010109057A1 (en) Method and apparatus for providing comments during content rendering
US20190147863A1 (en) Method and apparatus for playing multimedia
CN109165302A (zh) 多媒体文件推荐方法及装置
US20140164371A1 (en) Extraction of media portions in association with correlated input
US10382522B2 (en) Generating a dynamic user interface representing an arbitrary content provider back-end
WO2022012197A1 (zh) 信息推送方法、装置、电子设备及存储介质
CN107145509B (zh) 一种信息搜索方法及其设备
WO2023016349A1 (zh) 一种文本输入方法、装置、电子设备和存储介质
CN111324700A (zh) 资源召回方法、装置、电子设备及计算机可读存储介质
JP7140913B2 (ja) 映像配信時効の決定方法及び装置
CN109325180B (zh) 文章摘要推送方法、装置、终端设备、服务器及存储介质
CN111723289B (zh) 信息推荐方法及装置
CN110413834B (zh) 语音评论修饰方法、系统、介质和电子设备
CN111274819A (zh) 资源获取方法及装置
CN110827085A (zh) 文本处理方法、装置及设备
WO2022160603A1 (zh) 歌曲的推荐方法、装置、电子设备及存储介质
CN110598077A (zh) 一种云端资源内容筛选方法及装置
CN114298007A (zh) 一种文本相似度确定方法、装置、设备及介质