WO2024101667A1 - Method and system for searching for media message by using text extracted from media file - Google Patents

Method and system for searching for media message by using text extracted from media file Download PDF

Info

Publication number
WO2024101667A1
WO2024101667A1 PCT/KR2023/015308 KR2023015308W WO2024101667A1 WO 2024101667 A1 WO2024101667 A1 WO 2024101667A1 KR 2023015308 W KR2023015308 W KR 2023015308W WO 2024101667 A1 WO2024101667 A1 WO 2024101667A1
Authority
WO
WIPO (PCT)
Prior art keywords
text
media message
media
extracting
computer device
Prior art date
Application number
PCT/KR2023/015308
Other languages
French (fr)
Korean (ko)
Inventor
고원섭
Original Assignee
라인플러스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220148046A external-priority patent/KR20240066808A/en
Application filed by 라인플러스 주식회사 filed Critical 라인플러스 주식회사
Publication of WO2024101667A1 publication Critical patent/WO2024101667A1/en

Links

Images

Definitions

  • the description below relates to a method and system for searching media messages using text extracted from media files.
  • a sequence of instant messages sent and received through a specific session may be displayed to participants in the session through a chat room corresponding to the session.
  • a chat room corresponding to the session.
  • a media message search method and system that extracts text by analyzing visual information contained in messages sent and received through a specific session of an instant messaging service, and searches for the visual information using the text of the extracted visual information.
  • a media message retrieval method in a computer device including at least one processor, comprising: creating, by the at least one processor, a specific session of an instant messaging service or participating in the specific session; extracting, by the at least one processor, text from visual information included in a media message to be transmitted from the computer device through the specific session or a media message received from the computer device through the specific session; storing, by the at least one processor, the extracted text in association with a corresponding media message in a local database of the computer device; providing, by the at least one processor, a search interface in conjunction with the instant messaging service; and searching, by the at least one processor, a text associated with a keyword input through the search interface and a media message associated with the text in the local database.
  • the step of extracting the text may be characterized by extracting text included in the visual information.
  • the step of extracting the text may be characterized by extracting text for a category into which the visual information is classified.
  • the step of extracting the text may be characterized by extracting text for a format in which the text included in the visual information is classified.
  • the format may include at least one of a phone number format, an email address format, an account number format, a price format, and a business card format.
  • the step of extracting the text includes extracting the text of the sentence unit included in the visual information
  • the step of searching the media message includes the text of the sentence unit containing the keyword and the sentence unit It may be characterized by searching media messages associated with the text.
  • the step of extracting the text may be characterized by extracting the text from the visual information based on vision-based machine learning.
  • the step of extracting the text is based on an API (Application Programming Interface) call to a server providing a vision-based machine learning service from the visual information through a machine learning service provided by the server. It may be characterized by extracting text.
  • API Application Programming Interface
  • the extracted text may not be stored on a server providing the instant messaging service.
  • the visual information includes at least one of an image and a video
  • the step of extracting the text includes using a thumbnail extracted from the image or video as an input to a machine learning module to extract the text. It can be characterized by extracting .
  • the media message retrieval method may further include providing the retrieved media message.
  • providing the searched media message includes providing a search result list for text and media messages searched in the local database using the keyword; and providing an instant message so that in the sequence of instant messages transmitted and received through the specific session, a portion corresponding to the position of the instant message corresponding to the search result selected from the search result list is displayed.
  • the step of providing the searched media message includes providing the searched media message by displaying a portion corresponding to the location of the searched media message in a sequence of instant messages transmitted and received through the specific session. You can do this.
  • the media message retrieval method may further include registering the extracted text as a timeline tag for the visual information.
  • a computer program stored on a computer-readable recording medium is provided in conjunction with a computer device to execute the method on the computer device.
  • a computer-readable recording medium on which a program for executing the above method on a computer device is recorded.
  • At least one processor configured to execute instructions readable on a computer device, wherein the at least one processor creates or participates in a specific session of an instant messaging service, and through the specific session, Extract text from visual information included in a media message to be transmitted from a computer device or a media message received by the computer device through the specific session, and associate the extracted text with the corresponding media message to localize the computer device to the local media message.
  • a computer that stores text in a database, provides a search interface in connection with the instant messaging service, and searches the local database for text associated with a keyword entered through the search interface and media messages associated with the text. Provides a device.
  • Text can be extracted by analyzing visual information contained in messages sent and received through a specific session of an instant messaging service, and the visual information can be searched using the text of the extracted visual information.
  • FIG. 1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention.
  • Figure 2 is a block diagram showing an example of a computer device according to an embodiment of the present invention.
  • Figure 3 is a flowchart showing an example of a media message search method according to an embodiment of the present invention.
  • Figure 4 is a flowchart showing another example of a media message search method according to an embodiment of the present invention.
  • 5 to 9 are diagrams illustrating an example of providing a search interface according to an embodiment of the present invention.
  • Figure 10 is a flowchart showing an example of a search method for a media message containing visual information, according to an embodiment of the present invention.
  • Figure 11 is a diagram showing an actual example of visual information and an example of text that can be extracted from visual information, according to an embodiment of the present invention.
  • Figure 12 is a diagram illustrating an example of searching for a media message according to an embodiment of the present invention.
  • Figure 13 is a diagram illustrating another example of searching for a media message according to an embodiment of the present invention.
  • a media message retrieval system may be implemented by at least one computer device.
  • the computer program according to an embodiment of the present invention may be installed and driven in the computer device, and the computer device may perform the media message search method according to the embodiment of the present invention under the control of the driven computer program.
  • the above-described computer program can be combined with a computer device and stored in a computer-readable recording medium to cause the computer to execute the media message retrieval method.
  • FIG. 1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention.
  • the network environment in FIG. 1 shows an example including a plurality of electronic devices 110, 120, 130, and 140, a plurality of servers 150 and 160, and a network 170.
  • Figure 1 is an example for explaining the invention, and the number of electronic devices or servers is not limited as in Figure 1.
  • the network environment in FIG. 1 only explains one example of environments applicable to the present embodiments, and the environment applicable to the present embodiments is not limited to the network environment in FIG. 1.
  • the plurality of electronic devices 110, 120, 130, and 140 may be fixed terminals or mobile terminals implemented as computer devices. Examples of the plurality of electronic devices 110, 120, 130, and 140 include smart phones, mobile phones, navigation devices, computers, laptops, digital broadcasting terminals, PDAs (Personal Digital Assistants), and PMPs (Portable Multimedia Players). ), tablet PC, etc.
  • the shape of a smartphone is shown as an example of the electronic device 110.
  • the electronic device 110 actually communicates with other devices through the network 170 using a wireless or wired communication method. It may refer to one of various physical computer devices capable of communicating with electronic devices 120, 130, 140 and/or servers 150, 160.
  • the communication method is not limited, and may include not only a communication method utilizing a communication network that the network 170 may include (for example, a mobile communication network, wired Internet, wireless Internet, and a broadcast network), but also short-range wireless communication between devices.
  • the network 170 may include a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN).
  • PAN personal area network
  • LAN local area network
  • CAN campus area network
  • MAN metropolitan area network
  • WAN wide area network
  • BBN broadband network
  • the network 170 may include any one or more of network topologies including a bus network, star network, ring network, mesh network, star-bus network, tree or hierarchical network, etc. Not limited.
  • Each of the servers 150 and 160 is a computer device or a plurality of computers that communicate with a plurality of electronic devices 110, 120, 130, 140 and a network 170 to provide commands, codes, files, content, services, etc. It can be implemented with devices.
  • the server 150 provides services (e.g., instant messaging service, transaction (e.g., remittance) service, etc.) to a plurality of electronic devices (110, 120, 130, and 140) connected through the network 170.
  • FIG. 2 is a block diagram showing an example of a computer device according to an embodiment of the present invention.
  • Each of the plurality of electronic devices 110, 120, 130, and 140 described above or each of the servers 150 and 160 may be implemented by the computer device 200 shown in FIG. 2.
  • this computer device 200 may include a memory 210, a processor 220, a communication interface 230, and an input/output interface 240.
  • the memory 210 is a computer-readable recording medium and may include a non-permanent mass storage device such as random access memory (RAM), read only memory (ROM), and a disk drive.
  • RAM random access memory
  • ROM read only memory
  • disk drive non-perishable large-capacity recording devices such as ROM and disk drives may be included in the computer device 200 as a separate permanent storage device that is distinct from the memory 210.
  • an operating system and at least one program code may be stored in the memory 210. These software components may be loaded into the memory 210 from a computer-readable recording medium separate from the memory 210.
  • Such separate computer-readable recording media may include computer-readable recording media such as floppy drives, disks, tapes, DVD/CD-ROM drives, and memory cards.
  • software components may be loaded into the memory 210 through the communication interface 230 rather than a computer-readable recording medium.
  • software components may be loaded into memory 210 of computer device 200 based on computer programs installed by files received over network 170.
  • the processor 220 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Commands may be provided to the processor 220 by the memory 210 or the communication interface 230. For example, processor 220 may be configured to execute received instructions according to program code stored in a recording device such as memory 210.
  • the communication interface 230 may provide a function for the computer device 200 to communicate with other devices (eg, the storage devices described above) through the network 170. For example, a request, command, data, file, etc. generated by the processor 220 of the computer device 200 according to a program code stored in a recording device such as memory 210 is transmitted to the network ( 170) and can be transmitted to other devices. Conversely, signals, commands, data, files, etc. from other devices may be received by the computer device 200 through the communication interface 230 of the computer device 200 via the network 170. Signals, commands, data, etc. received through the communication interface 230 may be transmitted to the processor 220 or memory 210, and files, etc. may be stored in a storage medium (as described above) that the computer device 200 may further include. It can be stored as a permanent storage device).
  • a storage medium as described above
  • the input/output interface 240 may be a means for interfacing with the input/output device 250.
  • input devices may include devices such as a microphone, keyboard, or mouse, and output devices may include devices such as displays and speakers.
  • the input/output interface 240 may be a means for interfacing with a device that integrates input and output functions, such as a touch screen.
  • At least one of the input/output devices 250 may be configured as one device with the computer device 200. For example, like a smart phone, a touch screen, microphone, speaker, etc. may be included in the computer device 200.
  • computer device 200 may include fewer or more components than those of FIG. 2 . However, there is no need to clearly show most prior art components.
  • the computer device 200 may be implemented to include at least some of the input/output devices 250 described above, or may further include other components such as a transceiver, a database, etc.
  • FIG. 3 is a flowchart showing an example of a media message search method according to an embodiment of the present invention.
  • the media message search method according to this embodiment may be performed by the computer device 200 that implements a terminal that sends and/or receives instant messages by participating in a specific session using an instant messaging service.
  • the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program.
  • the processor 220 causes the computer device 200 to perform steps 310 to 350 included in the method of FIG. 3 according to control instructions provided by code stored in the computer device 200. can be controlled.
  • the computer device 200 may create a specific session of an instant messaging service or participate in a specific session.
  • a session of an instant messaging service may correspond to a specific chat room.
  • a sequence of instant messages sent and received through the session may be provided to participants of the session through a corresponding chat room.
  • the at least one computer program described above may be an application associated with an instant messaging service, and the computer device 200 is configured to provide instant messaging by at least one processor (e.g., processor 220) under the control of the application. You can access a server that provides messaging services to create a specific session or participate in a specific session that has already been created.
  • the computer device 200 analyzes a media message to be transmitted through a specific session or a media message received through a specific session and extracts keywords of the media included in the media message to be transmitted or the received media message. can do.
  • the computer device 200 may send instant messages through a corresponding session of an instant messaging service, and may also receive instant messages from other participants. At this time, an instant message containing only text can be classified as a text message, and an instant message containing media such as images, audio, and/or video can be classified as a media message.
  • the computer device 200 may analyze the media message before transmitting the media message and extract keywords of the media message to be transmitted.
  • the computer device 200 may extract keywords of the media included in the received media message. The method for extracting keywords from media will be explained in more detail later.
  • the computer device 200 may extract keywords of the media by directly analyzing the media included in the received media message.
  • the computer device 200 may simply receive keywords extracted from the sender's terminal that transmitted the media message.
  • the sender's terminal can analyze the media message it wants to transmit and extract keywords for the media included in the media message.
  • the sender's terminal can transmit the extracted media keyword along with the media message.
  • the transmitted media message may be delivered to the computer device 200 through a server providing an instant messaging service, and the computer device 200 may use the keywords contained in the received media message as keywords of the media contained in the media message. It can be extracted as.
  • the server delivering the media message may store the instant messages sent and received on the server for a certain period of time. In this case, when the server stores a media message, it can store the keyword of the media delivered with the media message in association with the media message. Keywords of media transmitted and stored to the server can be automatically registered as tags for timeline content related to the media at a later date.
  • the computer device 200 may store the keywords of the extracted media in a local database of the computer device in association with the identifier of the media message including the corresponding media.
  • These media keywords are media metadata and can be used to search for media messages containing specific media.
  • the local database may be implemented through the memory 210 of the computer device 200 or a persistent storage device described separately.
  • the computer device 200 may provide a search interface for instant messages transmitted and received through a specific session.
  • the search interface may include a user interface for receiving a keyword from the user, but depending on the embodiment, it may also include a user interface for receiving a keyword or category from the user.
  • the computer device 200 may provide a media message corresponding to an identifier searched in a local database using a keyword entered through a search interface.
  • the computer device 200 may provide a media message corresponding to the searched identifier such that a portion corresponding to the location of the media message corresponding to the searched identifier is displayed in a sequence of instant messages transmitted and received through a specific session. .
  • the computer device 200 may sequentially provide instant messages corresponding to keywords entered through a search interface from a sequence of instant messages transmitted and received in the corresponding session.
  • instant messages may include text messages and media messages.
  • the computer device 200 may sequentially provide a text message including a specific keyword and/or a media message with an identifier stored in the local device in association with the specific keyword according to a sequence of instant messages.
  • providing an instant message may include causing the position of the instant message in the sequence to be displayed in the chat room.
  • the computer device 200 may first display a list of search results corresponding to the input keyword on the screen.
  • the list of search results may include one or more search results, where each search result may include information about the corresponding instant message.
  • the search result may include an identifier of the sender of the text message, a profile image of the sender, and at least part of the corresponding text.
  • search results may include the sender's identifier, the sender's profile image, and information about the type of media the media message contains (images (photos), audio, video, etc.). there is.
  • the computer device 200 when a specific search result is selected by the user (for example, when a touch input is recognized in the area where the icon 520 is displayed by the user in a touch screen environment), the computer device 200 sends a sequence of instant messages. By displaying a part corresponding to the location of the instant message corresponding to the selected search result, an instant message corresponding to the search result can be provided to the user.
  • the computer device 200 can search for and provide not only text messages corresponding to keywords entered by the user through a search interface, but also media messages among instant messages transmitted and received through a specific session.
  • the computer device 200 may utilize a machine learning model to extract keywords from media included in a media message.
  • the computer device 200 extracts the category of the image as a keyword of the media including the image using a vision-based machine learning model learned to classify the category of the input image. You can.
  • the computer device 200 extracts the audio category as a keyword of the media including audio using a sound analysis-based machine learning model learned to classify the category of the input audio. can do.
  • media may include video.
  • the video may include multiple thumbnail images and audio.
  • the computer device 200 may extract the first category of thumbnail images of the video using a vision-based first machine learning model learned to classify the category of the input image, and select the category of the input audio.
  • the second category of audio of the video can be extracted using a second machine learning model based on sound analysis learned to classify.
  • the computer device 200 may determine at least one of the first category and the second category as a keyword for media including video.
  • the first category may include a plurality of categories for a plurality of thumbnail images.
  • the computer device 200 may finally determine the same category with the largest number among the plurality of categories included in the first category as the first category.
  • one or both of the first category and the second category can be determined as the keyword of the media.
  • media keywords may include one or more keywords.
  • keywords may be extracted for one image.
  • the keyword "Labrador” and the keyword “Retriever” may each be extracted as keywords for one image.
  • keywords of media may include multiple keywords.
  • a media message containing the corresponding media may be searched for any one of a plurality of keywords.
  • each machine learning model can be trained to output a category that is higher than a preset reliability level for the input image or audio.
  • Examples of these machine learning models include Multi-Layer Perceptron (MLP), Deep Neural Network (DNN), Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Group Convolutional Neural Network (G-CNN), and R-CNN.
  • MLP Multi-Layer Perceptron
  • DNN Deep Neural Network
  • CNN Convolutional Neural Network
  • RNN Recurrent Neural Network
  • G-CNN Group Convolutional Neural Network
  • R-CNN Group Convolutional Neural Network
  • R-CNN Group Convolutional Neural Network
  • R-CNN Group Convolutional Neural Network
  • One or more of various algorithms such as (Recurrent Convolutional Neural Network) can be used, and it is not limited to a specific algorithm.
  • each machine learning model can utilize one of the well-known models implemented to classify images or audio and output categories.
  • the well-known Core Machine Learning (Core Machine Learning) framework and Vision framework can be used, and if the confidence level of the classification is more than 70%, the identifier of the classification is used as a keyword. It can be regarded as Additionally, the well-known sound analysis framework (SoundAnalysis Framework) can be used to classify audio. Similar to the classification of images, if the reliability of the classification is more than 70%, the identifier of the classification can be considered a keyword.
  • FIG. 4 is a flowchart showing another example of a media message search method according to an embodiment of the present invention.
  • the media message retrieval method according to this embodiment may be performed by the computer device 200 implementing a server providing an instant messaging service.
  • the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program.
  • the processor 220 causes the computer device 200 to perform steps 410 to 440 included in the method of FIG. 4 according to control instructions provided by code stored in the computer device 200. can be controlled.
  • the computer device 200 may receive a media message and a keyword of the media included in the media message extracted by the sender's terminal that transmitted the media message through a specific session of the instant messaging service.
  • the keyword extracted by the sender's terminal may be a keyword of the media extracted for the media message to be transmitted in step 320 of FIG. 3.
  • the sender's terminal may extract the keywords of the media included in the media message and then transmit the extracted keywords of the media to the server along with the media message.
  • the computer device 200 may store keywords of the received media in association with the media message.
  • computer device 200 may store keywords of received media in a local database of computer device 200 in association with an identifier of the received media message.
  • the local database may be implemented through the memory 210 of the computer device 200 or a persistent storage device described separately.
  • the computer device 200 may transmit the received media message and the keyword of the media to the terminals of participants of a specific session. Through this, one media message can be searched on both the sender's terminal and the receiver's terminal of the media message.
  • the computer device 200 may register a keyword of the received media as a tag of timeline content related to the media.
  • the server may provide a timeline service for each member of the instant messaging service. At this time, when media included in a specific media message is registered in the timeline service as timeline content, the server can automatically register and utilize the keywords of the media extracted from the media message as tags of the timeline content.
  • 5 to 9 are diagrams illustrating an example of providing a search interface according to an embodiment of the present invention.
  • FIG. 5 shows an example of a chat room screen 510 on which at least part of a sequence of instant messages transmitted and received through a specific session of an instant messaging service is displayed.
  • Chat room screen 510 may include various user interfaces as well as at least a portion of a sequence of instant messages.
  • the chat room screen 510 may display an icon 520 for activating the search interface.
  • the search interface may be activated.
  • FIG. 6 shows an example of a chat room screen 610 with the search interface activated.
  • the chat room screen 610 shows an example of an input window interface 620 for displaying keywords input as a search interface and a keyboard interface for inputting keywords, such as the first dotted line box 630.
  • FIG. 7 shows an example of a chat room screen 710 in which the input keyword is displayed in the input window interface 620 as the keyword is input through the keyboard interface, and a list of search results corresponding to the input keyword is displayed. there is.
  • the second dotted box 720 represents part of the list of search results displayed on the chat room screen 710.
  • the user can select one of the displayed search results to access the instant message corresponding to the selected search result.
  • the search results indicate that in addition to text messages, they may include media messages including photos, videos, and/or audio.
  • media messages whose identifiers are linked to the input keyword “cat” and are stored in the local database of the terminal of the participant of the session.
  • the user's terminal can search for media messages through the identifier stored in association with the keyword “cat” in the local database.
  • the user's terminal can search for text messages containing the keyword “cat.”
  • the searched media messages and text messages can be sorted according to the sequence of instant messages sent and received in the session to generate a search result list.
  • FIG. 8 shows an example of a chat room screen 810 in which an instant message corresponding to the second search result is provided as the user selects the second search result in the chat room screen 710.
  • the chat room screen 810 displays a portion corresponding to the location of media message 3 820 among the sequence of instant messages transmitted and received through the session.
  • the third dotted box 830 serves as a first user interface for displaying previous search results
  • the fourth dotted line box 840 represents a second user interface for displaying next search results. It is showing.
  • the fifth dotted box 850 indicates that the currently displayed search result is the second search result out of 10 total search results.
  • FIG. 9 shows an example of a chat room screen 910 that displays the next search result as the user selects the second user interface displayed through the fourth dotted line box 840 in the chat room screen 810.
  • the next search result may correspond to a text message (text message 16 (920)) containing the text “The cat is pretty”, and the user's terminal may display instant messages sent and received in the session.
  • the portion corresponding to the location of the text message (text message 16 (920)) in the sequence can be displayed on the chat room screen (910).
  • FIG. 10 is a flowchart showing an example of a search method for a media message containing visual information, according to an embodiment of the present invention.
  • the media message search method may be performed by the computer device 200 that implements a terminal that sends and/or receives instant messages by participating in a specific session using an instant messaging service.
  • the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program.
  • the processor 220 causes the computer device 200 to perform steps 1010 to 1070 included in the method of FIG. 10 according to control instructions provided by code stored in the computer device 200. can be controlled.
  • the computer device 200 may create a specific session of an instant messaging service or participate in a specific session.
  • a session of an instant messaging service may correspond to a specific chat room.
  • a sequence of instant messages sent and received through the session may be provided to participants of the session through a corresponding chat room.
  • the at least one computer program described above may be an application associated with an instant messaging service, and the computer device 200 is configured to provide instant messaging under the control of the application by at least one processor (e.g., processor 220). You can access a server that provides messaging services to create a specific session or participate in a specific session that has already been created.
  • step 1020 the computer device 200 extracts text from a media message desired to be transmitted from the computer device 200 through a specific session or visual information included in a media message received to the computer device 200 through a specific session. can do.
  • the computer device 200 may directly include a machine learning model, but may receive a machine learning service provided by the server based on an API (Application Programming Interface) call to the server providing the vision-based machine learning service. there is.
  • the computer device 200 uses a thumbnail extracted from an image and/or video as visual information as an input to a machine learning module (a machine learning module included in the computer device 200 or included in the server). You can extract text.
  • the computer device 200 may extract text included in visual information.
  • the computer device 200 may recognize text in a photo or video and extract the recognized text.
  • the computer device 200 can extract text in sentence units, but is not limited to this.
  • the computer device 200 may extract text for a category into which visual information is classified. As a more specific example, if the category of a photo in which many people exist is classified as “person,” the computer device 200 may extract the category “person” as text.
  • the computer device 200 may extract text for a format in which text included in visual information is classified.
  • the format may include at least one of a phone number format, an email address format, an account number format, a price format, and a business card format.
  • a phone number such as “010-1234-5678”
  • the computer device 200 extracts text for formatting from the photo, such as “Phone Number” rather than “010-1234-5678”. It can be extracted.
  • the computer device 200 may extract text according to two or more of the above-described examples. For example, if a phone number such as “010-1234-5678” is included in the photo, the computer device 200 may display the text “010-1234-5678” and the text “010-1234-5678” included in the photo. You can also extract and utilize all of the text “Phone Number” for the format. As another example, from a photo containing the text "ABCDE” and many people, both the text "ABCDE” in the photo and the text "person” for the category can be extracted and utilized. In other words, multiple text sets may be extracted from one media message.
  • the computer device 200 may store the extracted text in a local database of the computer device 200 in association with the corresponding media message.
  • extracted text may not be stored on servers that provide instant messaging services.
  • the server providing the instant messaging service may temporarily store the text on the server to provide it to other users for matching with keywords.
  • the computer device 200 may provide a search interface in connection with an instant messaging service.
  • the search interface may include, for example, a user interface for receiving a keyword from the user, but depending on the embodiment, it may also include a user interface for receiving a keyword or category from the user.
  • the computer device 200 may search a local database for text associated with a keyword entered through a search interface and media messages associated with the text. For example, in a local database, the text and the identifier of the media message including the visual information from which the text was extracted may be stored in association with each other. In this case, the computer device 200 searches the local database for text containing the keyword entered through the search interface and then extracts the identifier of the media message associated with the text from the local database to search for text and media messages. You can.
  • the computer device 200 may provide the retrieved media message.
  • the computer device 200 may provide a search result list for text and media messages searched in a local database using keywords.
  • the computer device 200 selects a portion corresponding to the location of the instant message corresponding to the search result selected from the search result list in the sequence of instant messages transmitted and received through the specific session. You can provide an instant message to be displayed.
  • the computer device 200 may provide the searched media message by displaying a portion corresponding to the location of the searched media message in a sequence of instant messages transmitted and received through a specific session without providing a search result list.
  • the computer device 200 may register the extracted text as a timeline tag for visual information.
  • Visual information in media messages sent and received through a session of an instant messaging service may be uploaded as a post on a timeline associated with a specific user account.
  • the computer device 200 may automatically register text previously extracted from visual information as a timeline tag for visual information uploaded through a post on the timeline.
  • FIG. 11 is a diagram showing an actual example of visual information and an example of text that can be extracted from visual information, according to an embodiment of the present invention.
  • FIG. 11 shows an example of a photo 1100 prepared as an example of visual information and texts extracted from the photo 1100.
  • the photo 1100 can be input into a vision-based machine learning module, and the machine learning module can classify the category of the photo 1100 as “person.” In this case, the text “person” for the category may be extracted as the first text for the visual information.
  • the machine learning module can extract the texts included in the photo 1100, “#CLEANUPCOVID”, “Be A Good Neighbor”, and “Pick Up After”, as the second text, third text, and fourth text, respectively. there is.
  • the first to fourth texts may be stored in the local database of the computer device 200 in connection with the photo 1100 and/or the identifier of the photo 1100, which is visual information. If the text included in the visual information is text with a specific format, such as a phone number or account number, text such as “phone number” or “account number” for that format may be extracted.
  • a specific format such as a phone number or account number
  • Figure 12 is a diagram illustrating an example of searching for a media message according to an embodiment of the present invention. 12 shows not only a search result 1220 for a text message including the keyword "Up” as the keyword “Up” is input through the input window interface 1210 as a search interface for displaying the input keyword, but also the keyword "Up”. This shows an example in which a search result list including search results 1230 for media messages containing text including “Up” is displayed.
  • Figure 13 is a diagram illustrating another example of searching for a media message according to an embodiment of the present invention.
  • 13 shows a search result 1320 for a media message containing text including the keyword "Perso" as the keyword "Perso” is entered through the input window interface 1310 as a search interface for displaying the input keyword.
  • This shows an example in which a list of search results containing the text is displayed.
  • a media message corresponding to the selected search result may be provided to the user.
  • a media message may be provided to a user by displaying a portion corresponding to the location of the media message among a sequence of instant messages transmitted and received through a specific session, but the present invention is not limited to this.
  • the media message of the selected search result may be provided to the user by simply displaying the corresponding media message separately.
  • users can search for media messages containing visual information not only through the text containing the visual information, but also through the format of the text and/or the category (or topic, genre, etc.) of the visual information.
  • text is extracted by analyzing visual information included in a message transmitted and received through a specific session of an instant messaging service, and the text of the extracted visual information is used to search for the visual information. You can.
  • devices and components described in embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), etc. , may be implemented using one or more general-purpose or special-purpose computers, such as a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions.
  • the processing device may execute an operating system (OS) and one or more software applications running on the operating system. Additionally, a processing device may access, store, manipulate, process, and generate data in response to the execution of software.
  • OS operating system
  • a processing device may access, store, manipulate, process, and generate data in response to the execution of software.
  • a single processing device may be described as being used; however, those skilled in the art will understand that a processing device includes multiple processing elements and/or multiple types of processing elements. It can be seen that it may include.
  • a processing device may include a plurality of processors or one processor and one controller. Additionally, other processing configurations, such as parallel processors, are possible.
  • Software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing unit to operate as desired, or may be processed independently or collectively. You can command the device.
  • Software and/or data may be used on any type of machine, component, physical device, virtual equipment, computer storage medium or device to be interpreted by or to provide instructions or data to a processing device. It can be embodied in .
  • Software may be distributed over networked computer systems and thus stored or executed in a distributed manner.
  • Software and data may be stored on one or more computer-readable recording media.
  • the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium.
  • the computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination.
  • the medium may continuously store a computer-executable program, or may temporarily store it for execution or download.
  • the medium may be a variety of recording or storage means in the form of a single or several pieces of hardware combined. It is not limited to a medium directly connected to a computer system and may be distributed over a network.
  • Examples of media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, And there may be something configured to store program instructions, including ROM, RAM, flash memory, etc. Additionally, examples of other media include recording or storage media managed by app stores that distribute applications, sites that supply or distribute various other software, or servers. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc.

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

A method and a system for searching for a media message by using text extracted from a media file are disclosed. The media message search method according to an embodiment may comprise the steps of: generating a particular session of an instant messaging service or participating in the particular session; extracting text from visual information included in a media message to be transmitted from a computer device through the particular session or a media message having been received by the computer device through the particular session; storing the extracted text in a local database of the computer device in association with the corresponding media message; providing a search interface in association with the instant messaging service; and searching the local database for text associated with a keyword input via the search interface and a media message associated with the text.

Description

미디어 파일로부터 추출한 텍스트를 이용하여 미디어 메시지를 검색하는 방법 및 시스템Method and system for searching media messages using text extracted from media files
아래의 설명은 미디어 파일로부터 추출한 텍스트를 이용하여 미디어 메시지를 검색하는 방법 및 시스템에 관한 것이다.The description below relates to a method and system for searching media messages using text extracted from media files.
인스턴트 메시징 서비스에서 특정 세션을 통해 송수신된 인스턴트 메시지들의 시퀀스가 해당 세션에 해당하는 대화방(chat room)을 통해 해당 세션에 참가한 참가자들에게 표시될 수 있다. 이때, 인스턴트 메시지들의 수가 많아질수록 참가자들이 대화방 내에서 이전에 송수신된 특정 메시지를 찾기가 어려워질 수 있다.In an instant messaging service, a sequence of instant messages sent and received through a specific session may be displayed to participants in the session through a chat room corresponding to the session. At this time, as the number of instant messages increases, it may become difficult for participants to find specific messages previously sent and received within the chat room.
참가자들이 특정 메시지를 찾는 것을 돕기 위해, 특정 키워드를 포함하는 메시지를 검색하여 대화방내에서 인스턴트 메시지들의 시퀀스 중 검색된 메시지의 위치를 표시해주는 기능이 존재한다.To help participants find specific messages, a function exists that searches for messages containing specific keywords and displays the location of the searched message in a sequence of instant messages within the chat room.
인스턴트 메시징 서비스의 특정 세션을 통해 송수신된 메시지에 포함된 시각적 정보를 분석하여 텍스트를 추출하고, 추출된 시각적 정보의 텍스트를 활용하여 해당 시각적 정보를 검색할 수 있는 미디어 메시지 검색 방법 및 시스템을 제공한다.Provides a media message search method and system that extracts text by analyzing visual information contained in messages sent and received through a specific session of an instant messaging service, and searches for the visual information using the text of the extracted visual information. .
적어도 하나의 프로세서를 포함하는 컴퓨터 장치의 미디어 메시지 검색 방법에 있어서, 상기 적어도 하나의 프로세서에 의해, 인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 상기 특정 세션에 참여하는 단계; 상기 적어도 하나의 프로세서에 의해, 상기 특정 세션을 통해 상기 컴퓨터 장치에서 송신하고자 하는 미디어 메시지 또는 상기 특정 세션을 통해 상기 컴퓨터 장치로 수신된 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출하는 단계; 상기 적어도 하나의 프로세서에 의해, 상기 추출된 텍스트를 대응하는 미디어 메시지와 연계하여 상기 컴퓨터 장치의 로컬 데이터베이스에 저장하는 단계; 상기 적어도 하나의 프로세서에 의해, 상기 인스턴트 메시징 서비스와 연계하여 검색 인터페이스를 제공하는 단계; 및 상기 적어도 하나의 프로세서에 의해, 상기 로컬 데이터베이스에서 상기 검색 인터페이스를 통해 입력된 키워드와 연관된 텍스트를 및 상기 텍스트와 연계된 미디어 메시지를 검색하는 단계를 포함하는 미디어 메시지 검색 방법을 제공한다.1. A media message retrieval method in a computer device including at least one processor, comprising: creating, by the at least one processor, a specific session of an instant messaging service or participating in the specific session; extracting, by the at least one processor, text from visual information included in a media message to be transmitted from the computer device through the specific session or a media message received from the computer device through the specific session; storing, by the at least one processor, the extracted text in association with a corresponding media message in a local database of the computer device; providing, by the at least one processor, a search interface in conjunction with the instant messaging service; and searching, by the at least one processor, a text associated with a keyword input through the search interface and a media message associated with the text in the local database.
일측에 따르면, 상기 텍스트를 추출하는 단계는, 상기 시각적 정보가 포함하는 텍스트를 추출하는 것을 특징으로 할 수 있다.According to one side, the step of extracting the text may be characterized by extracting text included in the visual information.
다른 측면에 따르면, 상기 텍스트를 추출하는 단계는, 상기 시각적 정보가 분류되는 카테고리에 대한 텍스트를 추출하는 것을 특징으로 할 수 있다.According to another aspect, the step of extracting the text may be characterized by extracting text for a category into which the visual information is classified.
또 다른 측면에 따르면, 상기 텍스트를 추출하는 단계는, 상기 시각적 정보가 포함하는 텍스트가 분류되는 포맷에 대한 텍스트를 추출하는 것을 특징으로 할 수 있다.According to another aspect, the step of extracting the text may be characterized by extracting text for a format in which the text included in the visual information is classified.
또 다른 측면에 따르면, 상기 포맷은 전화번호 포맷, 이메일 주소 포맷, 계좌번호 포맷, 가격 포맷 및 명함 포맷 중 적어도 하나를 포함하는 것을 특징으로 할 수 있다.According to another aspect, the format may include at least one of a phone number format, an email address format, an account number format, a price format, and a business card format.
또 다른 측면에 따르면, 상기 텍스트를 추출하는 단계는, 상기 시각적 정보가 포함하는 문장 단위의 텍스트를 추출하고, 상기 미디어 메시지를 검색하는 단계는, 상기 키워드를 포함하는 문장 단위의 텍스트 및 상기 문장 단위의 텍스트와 연계된 미디어 메시지를 검색하는 것을 특징으로 할 수 있다.According to another aspect, the step of extracting the text includes extracting the text of the sentence unit included in the visual information, and the step of searching the media message includes the text of the sentence unit containing the keyword and the sentence unit It may be characterized by searching media messages associated with the text.
또 다른 측면에 따르면, 상기 텍스트를 추출하는 단계는, 비전(vision) 기반의 머신러닝에 기초하여 상기 시각적 정보로부터 텍스트를 추출하는 것을 특징으로 할 수 있다.According to another aspect, the step of extracting the text may be characterized by extracting the text from the visual information based on vision-based machine learning.
또 다른 측면에 따르면, 상기 텍스트를 추출하는 단계는, 비전 기반의 머신러닝 서비스를 제공하는 서버에 대한 API(Application Programming interface) 호출에 기초하여 상기 서버가 제공하는 머신러닝 서비스를 통해 상기 시각적 정보로부터 텍스트를 추출하는 것을 특징으로 할 수 있다.According to another aspect, the step of extracting the text is based on an API (Application Programming Interface) call to a server providing a vision-based machine learning service from the visual information through a machine learning service provided by the server. It may be characterized by extracting text.
또 다른 측면에 따르면, 상기 추출된 텍스트가 상기 인스턴트 메시징 서비스를 제공하는 서버에 저장되지 않는 것을 특징으로 할 수 있다.According to another aspect, the extracted text may not be stored on a server providing the instant messaging service.
또 다른 측면에 따르면, 상기 시각적 정보는 이미지 및 동영상 중 적어도 하나를 포함하고, 상기 텍스트를 추출하는 단계는, 상기 이미지 또는 동영상으로부터 추출되는 썸네일(thumbnail)을 머신러닝 모듈의 입력으로 활용하여 상기 텍스트를 추출하는 것을 특징으로 할 수 있다.According to another aspect, the visual information includes at least one of an image and a video, and the step of extracting the text includes using a thumbnail extracted from the image or video as an input to a machine learning module to extract the text. It can be characterized by extracting .
또 다른 측면에 따르면, 상기 미디어 메시지 검색 방법은, 상기 검색된 미디어 메시지를 제공하는 단계를 더 포함할 수 있다.According to another aspect, the media message retrieval method may further include providing the retrieved media message.
또 다른 측면에 따르면, 상기 검색된 미디어 메시지를 제공하는 단계는, 상기 키워드를 이용하여 상기 로컬 데이터베이스에서 검색된 텍스트 및 미디어 메시지에 대한 검색 결과 리스트를 제공하는 단계; 및 상기 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서, 상기 검색 결과 리스트에서 선택된 검색 결과에 대응하는 인스턴트 메시지의 위치에 대응하는 부분이 표시되도록 인스턴트 메시지를 제공하는 단계를 포함하는 것을 특징으로 할 수 있다.According to another aspect, providing the searched media message includes providing a search result list for text and media messages searched in the local database using the keyword; and providing an instant message so that in the sequence of instant messages transmitted and received through the specific session, a portion corresponding to the position of the instant message corresponding to the search result selected from the search result list is displayed. there is.
또 다른 측면에 따르면, 상기 검색된 미디어 메시지를 제공하는 단계는, 상기 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서 상기 검색된 미디어 메시지의 위치에 대응하는 부분을 표시하여 상기 검색된 미디어 메시지를 제공하는 것을 특징으로 할 수 있다.According to another aspect, the step of providing the searched media message includes providing the searched media message by displaying a portion corresponding to the location of the searched media message in a sequence of instant messages transmitted and received through the specific session. You can do this.
또 다른 측정에 따르면, 상기 미디어 메시지 검색 방법은, 상기 추출된 텍스트를 상기 시각적 정보를 위한 타임라인 태그로 등록하는 단계를 더 포함할 수 있다.According to another measurement, the media message retrieval method may further include registering the extracted text as a timeline tag for the visual information.
컴퓨터 장치와 결합되어 상기 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램을 제공한다.A computer program stored on a computer-readable recording medium is provided in conjunction with a computer device to execute the method on the computer device.
상기 방법을 컴퓨터 장치에 실행시키기 위한 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체를 제공한다.Provided is a computer-readable recording medium on which a program for executing the above method on a computer device is recorded.
컴퓨터 장치에서 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서에 의해, 인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 상기 특정 세션에 참여하고, 상기 특정 세션을 통해 상기 컴퓨터 장치에서 송신하고자 하는 미디어 메시지 또는 상기 특정 세션을 통해 상기 컴퓨터 장치로 수신된 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출하고, 상기 추출된 텍스트를 대응하는 미디어 메시지와 연계하여 상기 컴퓨터 장치의 로컬 데이터베이스에 저장하고, 상기 인스턴트 메시징 서비스와 연계하여 검색 인터페이스를 제공하고, 상기 로컬 데이터베이스에서 상기 검색 인터페이스를 통해 입력된 키워드와 연관된 텍스트를 및 상기 텍스트와 연계된 미디어 메시지를 검색하는 것을 특징으로 하는 컴퓨터 장치를 제공한다.At least one processor configured to execute instructions readable on a computer device, wherein the at least one processor creates or participates in a specific session of an instant messaging service, and through the specific session, Extract text from visual information included in a media message to be transmitted from a computer device or a media message received by the computer device through the specific session, and associate the extracted text with the corresponding media message to localize the computer device to the local media message. A computer that stores text in a database, provides a search interface in connection with the instant messaging service, and searches the local database for text associated with a keyword entered through the search interface and media messages associated with the text. Provides a device.
인스턴트 메시징 서비스의 특정 세션을 통해 송수신된 메시지에 포함된 시각적 정보를 분석하여 텍스트를 추출하고, 추출된 시각적 정보의 텍스트를 활용하여 해당 시각적 정보를 검색할 수 있다.Text can be extracted by analyzing visual information contained in messages sent and received through a specific session of an instant messaging service, and the visual information can be searched using the text of the extracted visual information.
도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다.1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따른 컴퓨터 장치의 예를 도시한 블록도이다.Figure 2 is a block diagram showing an example of a computer device according to an embodiment of the present invention.
도 3은 본 발명의 일실시예에 따른 미디어 메시지 검색 방법의 예를 도시한 흐름도이다.Figure 3 is a flowchart showing an example of a media message search method according to an embodiment of the present invention.
도 4는 본 발명의 일실시예에 따른 미디어 메시지 검색 방법의 다른 예를 도시한 흐름도이다.Figure 4 is a flowchart showing another example of a media message search method according to an embodiment of the present invention.
도 5 내지 도 9는 본 발명의 일실시예에 있어서, 검색 인터페이스를 제공하는 예를 도시한 도면들이다.5 to 9 are diagrams illustrating an example of providing a search interface according to an embodiment of the present invention.
도 10은 본 발명의 일실시예에 있어서, 시각적 정보를 포함하는 미디어 메시지에 대한 검색 방법의 예를 도시한 흐름도이다.Figure 10 is a flowchart showing an example of a search method for a media message containing visual information, according to an embodiment of the present invention.
도 11은 본 발명의 일실시예에 있어서, 시각적 정보의 실제 예시와 시각적 정보로부터 추출될 수 있는 텍스트의 예시를 도시한 도면이다.Figure 11 is a diagram showing an actual example of visual information and an example of text that can be extracted from visual information, according to an embodiment of the present invention.
도 12는 본 발명의 일실시예에 있어서, 미디어 메시지를 검색하는 예를 도시한 도면이다.Figure 12 is a diagram illustrating an example of searching for a media message according to an embodiment of the present invention.
도 13은 본 발명의 일실시예에 있어서, 미디어 메시지를 검색하는 다른 예를 도시한 도면이다.Figure 13 is a diagram illustrating another example of searching for a media message according to an embodiment of the present invention.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings.
본 발명의 실시예들에 따른 미디어 메시지 검색 시스템은 적어도 하나의 컴퓨터 장치에 의해 구현될 수 있다. 이때, 컴퓨터 장치에는 본 발명의 일실시예에 따른 컴퓨터 프로그램이 설치 및 구동될 수 있고, 컴퓨터 장치는 구동된 컴퓨터 프로그램의 제어에 따라 본 발명의 실시예들에 따른 미디어 메시지 검색 방법을 수행할 수 있다. 상술한 컴퓨터 프로그램은 컴퓨터 장치와 결합되어 미디어 메시지 검색 방법을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장될 수 있다.A media message retrieval system according to embodiments of the present invention may be implemented by at least one computer device. At this time, the computer program according to an embodiment of the present invention may be installed and driven in the computer device, and the computer device may perform the media message search method according to the embodiment of the present invention under the control of the driven computer program. there is. The above-described computer program can be combined with a computer device and stored in a computer-readable recording medium to cause the computer to execute the media message retrieval method.
도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다. 도 1의 네트워크 환경은 복수의 전자 기기들(110, 120, 130, 140), 복수의 서버들(150, 160) 및 네트워크(170)를 포함하는 예를 나타내고 있다. 이러한 도 1은 발명의 설명을 위한 일례로 전자 기기의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다. 또한, 도 1의 네트워크 환경은 본 실시예들에 적용 가능한 환경들 중 하나의 예를 설명하는 것일 뿐, 본 실시예들에 적용 가능한 환경이 도 1의 네트워크 환경으로 한정되는 것은 아니다.1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention. The network environment in FIG. 1 shows an example including a plurality of electronic devices 110, 120, 130, and 140, a plurality of servers 150 and 160, and a network 170. Figure 1 is an example for explaining the invention, and the number of electronic devices or servers is not limited as in Figure 1. In addition, the network environment in FIG. 1 only explains one example of environments applicable to the present embodiments, and the environment applicable to the present embodiments is not limited to the network environment in FIG. 1.
복수의 전자 기기들(110, 120, 130, 140)은 컴퓨터 장치로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 복수의 전자 기기들(110, 120, 130, 140)의 예를 들면, 스마트폰(smart phone), 휴대폰, 네비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등이 있다. 일례로 도 1에서는 전자 기기(110)의 예로 스마트폰의 형상을 나타내고 있으나, 본 발명의 실시예들에서 전자 기기(110)는 실질적으로 무선 또는 유선 통신 방식을 이용하여 네트워크(170)를 통해 다른 전자 기기들(120, 130, 140) 및/또는 서버(150, 160)와 통신할 수 있는 다양한 물리적인 컴퓨터 장치들 중 하나를 의미할 수 있다.The plurality of electronic devices 110, 120, 130, and 140 may be fixed terminals or mobile terminals implemented as computer devices. Examples of the plurality of electronic devices 110, 120, 130, and 140 include smart phones, mobile phones, navigation devices, computers, laptops, digital broadcasting terminals, PDAs (Personal Digital Assistants), and PMPs (Portable Multimedia Players). ), tablet PC, etc. For example, in FIG. 1, the shape of a smartphone is shown as an example of the electronic device 110. However, in embodiments of the present invention, the electronic device 110 actually communicates with other devices through the network 170 using a wireless or wired communication method. It may refer to one of various physical computer devices capable of communicating with electronic devices 120, 130, 140 and/or servers 150, 160.
통신 방식은 제한되지 않으며, 네트워크(170)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(170)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(170)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and may include not only a communication method utilizing a communication network that the network 170 may include (for example, a mobile communication network, wired Internet, wireless Internet, and a broadcast network), but also short-range wireless communication between devices. For example, the network 170 may include a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN). , may include one or more arbitrary networks such as the Internet. Additionally, the network 170 may include any one or more of network topologies including a bus network, star network, ring network, mesh network, star-bus network, tree or hierarchical network, etc. Not limited.
서버(150, 160) 각각은 복수의 전자 기기들(110, 120, 130, 140)과 네트워크(170)를 통해 통신하여 명령, 코드, 파일, 컨텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 서버(150)는 네트워크(170)를 통해 접속한 복수의 전자 기기들(110, 120, 130, 140)로 서비스(일례로, 인스턴트 메시징 서비스, 거래(일례로, 송금) 서비스, 결제 서비스, 가상 거래소 서비스, 리스크 모니터링 서비스, 게임 서비스, 그룹 통화 서비스(또는 음성 컨퍼런스 서비스), 메시징 서비스, 메일 서비스, 소셜 네트워크 서비스, 지도 서비스, 번역 서비스, 금융 서비스, 검색 서비스 및/또는 컨텐츠 제공 서비스 등)를 제공하는 시스템일 수 있다.Each of the servers 150 and 160 is a computer device or a plurality of computers that communicate with a plurality of electronic devices 110, 120, 130, 140 and a network 170 to provide commands, codes, files, content, services, etc. It can be implemented with devices. For example, the server 150 provides services (e.g., instant messaging service, transaction (e.g., remittance) service, etc.) to a plurality of electronic devices (110, 120, 130, and 140) connected through the network 170. Payment services, virtual exchange services, risk monitoring services, gaming services, group call services (or voice conference services), messaging services, mail services, social network services, map services, translation services, financial services, search services and/or content provision. It may be a system that provides services, etc.).
도 2는 본 발명의 일실시예에 따른 컴퓨터 장치의 예를 도시한 블록도이다. 앞서 설명한 복수의 전자 기기들(110, 120, 130, 140) 각각이나 서버들(150, 160) 각각은 도 2를 통해 도시된 컴퓨터 장치(200)에 의해 구현될 수 있다.Figure 2 is a block diagram showing an example of a computer device according to an embodiment of the present invention. Each of the plurality of electronic devices 110, 120, 130, and 140 described above or each of the servers 150 and 160 may be implemented by the computer device 200 shown in FIG. 2.
이러한 컴퓨터 장치(200)는 도 2에 도시된 바와 같이, 메모리(210), 프로세서(220), 통신 인터페이스(230) 그리고 입출력 인터페이스(240)를 포함할 수 있다. 메모리(210)는 컴퓨터에서 판독 가능한 기록매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM과 디스크 드라이브와 같은 비소멸성 대용량 기록장치는 메모리(210)와는 구분되는 별도의 영구 저장 장치로서 컴퓨터 장치(200)에 포함될 수도 있다. 또한, 메모리(210)에는 운영체제와 적어도 하나의 프로그램 코드가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(210)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 메모리(210)로 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 인터페이스(230)를 통해 메모리(210)에 로딩될 수도 있다. 예를 들어, 소프트웨어 구성요소들은 네트워크(170)를 통해 수신되는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 컴퓨터 장치(200)의 메모리(210)에 로딩될 수 있다.As shown in FIG. 2, this computer device 200 may include a memory 210, a processor 220, a communication interface 230, and an input/output interface 240. The memory 210 is a computer-readable recording medium and may include a non-permanent mass storage device such as random access memory (RAM), read only memory (ROM), and a disk drive. Here, non-perishable large-capacity recording devices such as ROM and disk drives may be included in the computer device 200 as a separate permanent storage device that is distinct from the memory 210. Additionally, an operating system and at least one program code may be stored in the memory 210. These software components may be loaded into the memory 210 from a computer-readable recording medium separate from the memory 210. Such separate computer-readable recording media may include computer-readable recording media such as floppy drives, disks, tapes, DVD/CD-ROM drives, and memory cards. In another embodiment, software components may be loaded into the memory 210 through the communication interface 230 rather than a computer-readable recording medium. For example, software components may be loaded into memory 210 of computer device 200 based on computer programs installed by files received over network 170.
프로세서(220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(210) 또는 통신 인터페이스(230)에 의해 프로세서(220)로 제공될 수 있다. 예를 들어 프로세서(220)는 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.The processor 220 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Commands may be provided to the processor 220 by the memory 210 or the communication interface 230. For example, processor 220 may be configured to execute received instructions according to program code stored in a recording device such as memory 210.
통신 인터페이스(230)는 네트워크(170)를 통해 컴퓨터 장치(200)가 다른 장치(일례로, 앞서 설명한 저장 장치들)와 서로 통신하기 위한 기능을 제공할 수 있다. 일례로, 컴퓨터 장치(200)의 프로세서(220)가 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이나 명령, 데이터, 파일 등이 통신 인터페이스(230)의 제어에 따라 네트워크(170)를 통해 다른 장치들로 전달될 수 있다. 역으로, 다른 장치로부터의 신호나 명령, 데이터, 파일 등이 네트워크(170)를 거쳐 컴퓨터 장치(200)의 통신 인터페이스(230)를 통해 컴퓨터 장치(200)로 수신될 수 있다. 통신 인터페이스(230)를 통해 수신된 신호나 명령, 데이터 등은 프로세서(220)나 메모리(210)로 전달될 수 있고, 파일 등은 컴퓨터 장치(200)가 더 포함할 수 있는 저장 매체(상술한 영구 저장 장치)로 저장될 수 있다.The communication interface 230 may provide a function for the computer device 200 to communicate with other devices (eg, the storage devices described above) through the network 170. For example, a request, command, data, file, etc. generated by the processor 220 of the computer device 200 according to a program code stored in a recording device such as memory 210 is transmitted to the network ( 170) and can be transmitted to other devices. Conversely, signals, commands, data, files, etc. from other devices may be received by the computer device 200 through the communication interface 230 of the computer device 200 via the network 170. Signals, commands, data, etc. received through the communication interface 230 may be transmitted to the processor 220 or memory 210, and files, etc. may be stored in a storage medium (as described above) that the computer device 200 may further include. It can be stored as a permanent storage device).
입출력 인터페이스(240)는 입출력 장치(250)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 마이크, 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 입출력 장치(250) 중 적어도 하나는 컴퓨터 장치(200)와 하나의 장치로 구성될 수도 있다. 예를 들어, 스마트폰과 같이 터치스크린, 마이크, 스피커 등이 컴퓨터 장치(200)에 포함된 형태로 구현될 수 있다. The input/output interface 240 may be a means for interfacing with the input/output device 250. For example, input devices may include devices such as a microphone, keyboard, or mouse, and output devices may include devices such as displays and speakers. As another example, the input/output interface 240 may be a means for interfacing with a device that integrates input and output functions, such as a touch screen. At least one of the input/output devices 250 may be configured as one device with the computer device 200. For example, like a smart phone, a touch screen, microphone, speaker, etc. may be included in the computer device 200.
또한, 다른 실시예들에서 컴퓨터 장치(200)는 도 2의 구성요소들보다 더 적은 혹은 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 컴퓨터 장치(200)는 상술한 입출력 장치(250) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Additionally, in other embodiments, computer device 200 may include fewer or more components than those of FIG. 2 . However, there is no need to clearly show most prior art components. For example, the computer device 200 may be implemented to include at least some of the input/output devices 250 described above, or may further include other components such as a transceiver, a database, etc.
도 3은 본 발명의 일실시예에 따른 미디어 메시지 검색 방법의 예를 도시한 흐름도이다. 본 실시예에 따른 미디어 메시지 검색 방법은 인스턴트 메시징 서비스를 이용하여 특정 세션에 참여하여 인스턴트 메시지를 전송하거나 및/또는 수신하는 단말기를 구현하는 컴퓨터 장치(200)에 의해 수행될 수 있다. 이때, 컴퓨터 장치(200)의 프로세서(220)는 메모리(210)가 포함하는 운영체제의 코드나 적어도 하나의 컴퓨터 프로그램의 코드에 따른 제어 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 프로세서(220)는 컴퓨터 장치(200)에 저장된 코드가 제공하는 제어 명령에 따라 컴퓨터 장치(200)가 도 3의 방법이 포함하는 단계들(310 내지 350)을 수행하도록 컴퓨터 장치(200)를 제어할 수 있다.Figure 3 is a flowchart showing an example of a media message search method according to an embodiment of the present invention. The media message search method according to this embodiment may be performed by the computer device 200 that implements a terminal that sends and/or receives instant messages by participating in a specific session using an instant messaging service. At this time, the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program. Here, the processor 220 causes the computer device 200 to perform steps 310 to 350 included in the method of FIG. 3 according to control instructions provided by code stored in the computer device 200. can be controlled.
단계(310)에서 컴퓨터 장치(200)는 인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 특정 세션에 참여할 수 있다. 인스턴트 메시징 서비스의 세션은 특정 대화방(chat room)에 대응될 수 있다. 해당 세션을 통해 송수신된 인스턴트 메시지들의 시퀀스가 대응하는 대화방을 통해 해당 세션의 참여자들에게 제공될 수 있다. 일례로, 상술한 적어도 하나의 컴퓨터 프로그램은 인스턴트 메시징 서비스와 연계된 어플리케이션일 수 있으며, 컴퓨터 장치(200)는 적어도 하나의 프로세서(일례로, 프로세서(220))에 의해, 어플리케이션의 제어에 따라 인스턴트 메시징 서비스를 제공하는 서버에 접근하여 특정 세션을 생성하거나 또는 이미 생성되어 있는 특정 세션에 참여할 수 있다.In step 310, the computer device 200 may create a specific session of an instant messaging service or participate in a specific session. A session of an instant messaging service may correspond to a specific chat room. A sequence of instant messages sent and received through the session may be provided to participants of the session through a corresponding chat room. For example, the at least one computer program described above may be an application associated with an instant messaging service, and the computer device 200 is configured to provide instant messaging by at least one processor (e.g., processor 220) under the control of the application. You can access a server that provides messaging services to create a specific session or participate in a specific session that has already been created.
단계(320)에서 컴퓨터 장치(200)는 특정 세션을 통해 송신하고자 하는 미디어 메시지 또는 특정 세션을 통해 수신된 미디어 메시지를 분석하여 송신하고자 하는 미디어 메시지 또는 수신된 미디어 메시지에 포함된 미디어의 키워드를 추출할 수 있다. 컴퓨터 장치(200)는 인스턴트 메시징 서비스의 해당 세션을 통해 인스턴트 메시지를 송신할 수도 있고, 다른 참가자의 인스턴트 메시지를 수신할 수도 있다. 이때, 텍스트만을 포함하는 인스턴트 메시지를 텍스트 메시지로, 이미지, 오디오 및/또는 비디오와 같은 미디어를 포함하는 인스턴트 메시지를 미디어 메시지로 분류할 수 있다. 컴퓨터 장치(200)는 미디어가 포함된 미디어 메시지를 송신하고자 하는 경우, 미디어 메시지의 송신 이전에 미디어 메시지를 분석하여 송신하고자 하는 미디어 메시지의 키워드를 추출할 수 있다. 다른 예로, 컴퓨터 장치(200)는 미디어를 포함하는 미디어 메시지를 수신하는 경우, 수신된 미디어 메시지에 포함된 미디어의 키워드를 추출할 수도 있다. 미디어의 키워드를 추출하는 방법에 대해서는 이후 더욱 자세히 설명한다.In step 320, the computer device 200 analyzes a media message to be transmitted through a specific session or a media message received through a specific session and extracts keywords of the media included in the media message to be transmitted or the received media message. can do. The computer device 200 may send instant messages through a corresponding session of an instant messaging service, and may also receive instant messages from other participants. At this time, an instant message containing only text can be classified as a text message, and an instant message containing media such as images, audio, and/or video can be classified as a media message. When the computer device 200 wishes to transmit a media message containing media, the computer device 200 may analyze the media message before transmitting the media message and extract keywords of the media message to be transmitted. As another example, when receiving a media message containing media, the computer device 200 may extract keywords of the media included in the received media message. The method for extracting keywords from media will be explained in more detail later.
한편 일실시예에서, 컴퓨터 장치(200)는 수신된 미디어 메시지가 포함하는 미디어를 직접 분석하여 미디어의 키워드를 추출할 수 있다. 다른 실시예에서, 컴퓨터 장치(200)는 미디어 메시지를 송신한 송신자측 단말기에서 추출된 키워드를 단순히 수신할 수도 있다. 일례로, 송신자측 단말기는 자신이 송신하고자 하는 미디어 메시지를 분석하여 미디어 메시지가 포함하는 미디어의 키워드를 추출할 수 있다. 이후, 송신자측 단말기는 미디어 메시지와 함께 추출된 미디어의 키워드를 송신할 수 있다. 송신된 미디어 메시지는 인스턴트 메시징 서비스를 제공하는 서버를 통해 컴퓨터 장치(200)로 전달될 수 있으며, 컴퓨터 장치(200)는 수신된 미디어 메시지에 포함되어 있는 키워드를 해당 미디어 메시지가 포함하는 미디어의 키워드로서 추출할 수 있다. 이때, 미디어 메시지를 전달하는 서버는 송수신되는 인스턴트 메시지들을 서버에 일정 기간 저장할 수 있다. 이 경우, 서버는 미디어 메시지를 저장할 때, 해당 미디어 메시지와 함께 전달된 미디어의 키워드를 해당 미디어 메시지와 연계하여 저장할 수 있다. 서버로 전달되어 저장된 미디어의 키워드들은 추후 해당 미디어와 관련된 타임라인 컨텐츠의 태그로 자동 등록될 수 있다.Meanwhile, in one embodiment, the computer device 200 may extract keywords of the media by directly analyzing the media included in the received media message. In another embodiment, the computer device 200 may simply receive keywords extracted from the sender's terminal that transmitted the media message. For example, the sender's terminal can analyze the media message it wants to transmit and extract keywords for the media included in the media message. Afterwards, the sender's terminal can transmit the extracted media keyword along with the media message. The transmitted media message may be delivered to the computer device 200 through a server providing an instant messaging service, and the computer device 200 may use the keywords contained in the received media message as keywords of the media contained in the media message. It can be extracted as. At this time, the server delivering the media message may store the instant messages sent and received on the server for a certain period of time. In this case, when the server stores a media message, it can store the keyword of the media delivered with the media message in association with the media message. Keywords of media transmitted and stored to the server can be automatically registered as tags for timeline content related to the media at a later date.
단계(330)에서 컴퓨터 장치(200)는 추출된 미디어의 키워드를, 대응하는 미디어를 포함하는 미디어 메시지의 식별자와 연계하여 컴퓨터 장치의 로컬 데이터베이스에 저장할 수 있다. 이러한 미디어의 키워드는 미디어의 메타데이터로서 특정 미디어를 포함하는 미디어 메시지를 검색하는데 활용될 수 있다. 여기서 로컬 데이터베이스는 앞서 컴퓨터 장치(200)의 메모리(210)나 별도로 설명한 영구 저장 장치를 통해 구현될 수 있다.In step 330, the computer device 200 may store the keywords of the extracted media in a local database of the computer device in association with the identifier of the media message including the corresponding media. These media keywords are media metadata and can be used to search for media messages containing specific media. Here, the local database may be implemented through the memory 210 of the computer device 200 or a persistent storage device described separately.
단계(340)에서 컴퓨터 장치(200)는 특정 세션을 통해 송수신된 인스턴트 메시지에 대한 검색 인터페이스를 제공할 수 있다. 검색 인터페이스는 일례로 사용자로부터 키워드를 입력받기 위한 사용자 인터페이스를 포함할 수 있으나, 실시예에 따라 사용자로부터 키워드나 카테고리 등을 선택받기 위한 사용자 인터페이스를 포함할 수도 있다.In step 340, the computer device 200 may provide a search interface for instant messages transmitted and received through a specific session. For example, the search interface may include a user interface for receiving a keyword from the user, but depending on the embodiment, it may also include a user interface for receiving a keyword or category from the user.
단계(350)에서 컴퓨터 장치(200)는 검색 인터페이스를 통해 입력된 키워드를 이용하여 로컬 데이터베이스에서 검색된 식별자에 대응하는 미디어 메시지를 제공할 수 있다.In step 350, the computer device 200 may provide a media message corresponding to an identifier searched in a local database using a keyword entered through a search interface.
일실시예로, 컴퓨터 장치(200)는 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서 검색된 식별자에 대응하는 미디어 메시지의 위치에 대응하는 부분이 표시되도록 검색된 식별자에 대응하는 미디어 메시지를 제공할 수 있다. 보다 구체적인 예로, 컴퓨터 장치(200)는 해당 세션에서 송수신된 인스턴트 메시지들의 시퀀스에서 검색 인터페이스를 통해 입력된 키워드에 대응하는 인스턴트 메시지를 순차적으로 제공할 수 있다. 이미 설명한 바와 같이 인스턴트 메시지는 텍스트 메시지와 미디어 메시지를 포함할 수 있다. 이 경우, 컴퓨터 장치(200)는 특정한 키워드를 포함하는 텍스트 메시지 및/또는 특정한 키워드와 연계하여 로컬 디바이스에 저장된 식별자의 미디어 메시지를 인스턴트 메시지들의 시퀀스에 따라 순차적으로 제공할 수 있다. 여기서 인스턴트 메시지를 제공하는 것은 해당 시퀀스에서 해당 인스턴트 메시지의 위치가 대화방에 표시되도록 하는 것을 포함할 수 있다.In one embodiment, the computer device 200 may provide a media message corresponding to the searched identifier such that a portion corresponding to the location of the media message corresponding to the searched identifier is displayed in a sequence of instant messages transmitted and received through a specific session. . As a more specific example, the computer device 200 may sequentially provide instant messages corresponding to keywords entered through a search interface from a sequence of instant messages transmitted and received in the corresponding session. As already explained, instant messages may include text messages and media messages. In this case, the computer device 200 may sequentially provide a text message including a specific keyword and/or a media message with an identifier stored in the local device in association with the specific keyword according to a sequence of instant messages. Here, providing an instant message may include causing the position of the instant message in the sequence to be displayed in the chat room.
다른 실시예로, 컴퓨터 장치(200)는 입력된 키워드에 대응하는 검색 결과들의 리스트를 먼저 화면에 표시할 수 있다. 검색 결과들의 리스트는 하나 이상의 검색 결과를 포함할 수 있으며, 이때 각 검색 결과는 대응하는 인스턴트 메시지에 대한 정보를 포함할 수 있다. 일례로, 검색 결과는 텍스트 메시지의 경우, 텍스트 메시지의 송신자의 식별자, 송신자의 프로필 이미지, 그리고 대응하는 텍스트의 적어도 일부를 포함할 수 있다. 다른 예로, 검색 결과는 미디어 메시지의 경우, 송신자의 식별자, 송신자의 프로필 이미지, 그리고 미디어 메시지가 포함하는 미디어의 종류(이미지(사진), 오디오, 비디오(동영상) 등)에 대한 정보를 포함할 수 있다. 이 경우, 특정 검색 결과가 사용자에 의해 선택되는 경우(일례로, 터치스크린 환경에서 사용자에 의해 아이콘(520)이 표시된 영역에 터치입력이 인식되는 경우), 컴퓨터 장치(200)는 인스턴트 메시지들의 시퀀스에서, 선택된 검색 결과에 대응하는 인스턴트 메시지의 위치에 대응하는 부분을 표시함으로써, 해당 검색 결과에 대응하는 인스턴트 메시지를 사용자에게 제공할 수 있다. In another embodiment, the computer device 200 may first display a list of search results corresponding to the input keyword on the screen. The list of search results may include one or more search results, where each search result may include information about the corresponding instant message. For example, in the case of a text message, the search result may include an identifier of the sender of the text message, a profile image of the sender, and at least part of the corresponding text. As another example, for media messages, search results may include the sender's identifier, the sender's profile image, and information about the type of media the media message contains (images (photos), audio, video, etc.). there is. In this case, when a specific search result is selected by the user (for example, when a touch input is recognized in the area where the icon 520 is displayed by the user in a touch screen environment), the computer device 200 sends a sequence of instant messages. By displaying a part corresponding to the location of the instant message corresponding to the selected search result, an instant message corresponding to the search result can be provided to the user.
따라서, 컴퓨터 장치(200)는 특정 세션을 통해 송수신된 인스턴트 메시지들 중에서 사용자로부터 검색 인터페이스를 통해 입력된 키워드에 대응하는 텍스트 메시지뿐만 아니라, 미디어 메시지까지 검색하여 제공할 수 있게 된다.Accordingly, the computer device 200 can search for and provide not only text messages corresponding to keywords entered by the user through a search interface, but also media messages among instant messages transmitted and received through a specific session.
한편, 컴퓨터 장치(200)는 미디어 메시지가 포함하는 미디어로부터 키워드를 추출하기 위해, 머신러닝 모델을 활용할 수 있다.Meanwhile, the computer device 200 may utilize a machine learning model to extract keywords from media included in a media message.
일례로, 미디어가 이미지를 포함하는 경우, 컴퓨터 장치(200)는 입력되는 이미지의 카테고리를 분류하도록 학습된 비전 기반의 머신러닝 모델을 이용하여 이미지의 카테고리를 이미지를 포함하는 미디어의 키워드로서 추출할 수 있다.For example, when the media includes an image, the computer device 200 extracts the category of the image as a keyword of the media including the image using a vision-based machine learning model learned to classify the category of the input image. You can.
다른 예로, 미디어가 오디오를 포함하는 경우, 컴퓨터 장치(200)는 입력되는 오디오의 카테고리를 분류하도록 학습된 사운드 분석 기반의 머신러닝 모델을 이용하여 오디오의 카테고리를 오디오를 포함하는 미디어의 키워드로서 추출할 수 있다.As another example, when the media includes audio, the computer device 200 extracts the audio category as a keyword of the media including audio using a sound analysis-based machine learning model learned to classify the category of the input audio. can do.
또 다른 예로, 미디어가 비디오를 포함할 수도 있다. 이때, 비디오는 다수의 썸네일 이미지들과 오디오를 포함할 수 있다. 이 경우, 컴퓨터 장치(200)는 입력되는 이미지의 카테고리를 분류하도록 학습된 비전 기반의 제1 머신러닝 모델을 이용하여 비디오의 썸네일 이미지들의 제1 카테고리를 추출할 수 있으며, 입력되는 오디오의 카테고리를 분류하도록 학습된 사운드 분석 기반의 제2 머신러닝 모델을 이용하여 상기 비디오의 오디오의 제2 카테고리를 추출할 수 있다. 이후, 컴퓨터 장치(200)는 제1 카테고리 및 제2 카테고리 중 적어도 하나를 비디오를 포함하는 미디어의 키워드로서 결정할 수 있다. 이때, 제1 카테고리는 다수의 썸네일 이미지들에 대한 복수 개의 카테고리들을 포함할 수도 있다. 일례로, 컴퓨터 장치(200)는 제1 카테고리가 포함하는 복수 개의 카테고리들 중 가장 많은 수의 동일한 카테고리를 제1 카테고리로 최종 결정할 수 있다. 이후, 제1 카테고리와 제2 카테고리 중 어느 하나 또는 둘 모두를 미디어의 키워드로서 결정할 수 있다. 이처럼, 미디어의 키워드는 하나 이상의 키워드를 포함할 수도 있다.As another example, media may include video. At this time, the video may include multiple thumbnail images and audio. In this case, the computer device 200 may extract the first category of thumbnail images of the video using a vision-based first machine learning model learned to classify the category of the input image, and select the category of the input audio. The second category of audio of the video can be extracted using a second machine learning model based on sound analysis learned to classify. Thereafter, the computer device 200 may determine at least one of the first category and the second category as a keyword for media including video. At this time, the first category may include a plurality of categories for a plurality of thumbnail images. For example, the computer device 200 may finally determine the same category with the largest number among the plurality of categories included in the first category as the first category. Afterwards, one or both of the first category and the second category can be determined as the keyword of the media. In this way, media keywords may include one or more keywords.
한편, 하나의 이미지에 대해 복수의 키워드들이 추출될 수도 있다. 일례로, '래브라도 리트리버(Labrador Retriever)'인 경우, 키워드 "래브라도(Labrador)"와 키워드 "리트리버(Retriever)"가 각각 하나의 이미지에 대한 키워드들로 추출될 수도 있다. 이처럼, 미디어의 키워드는 복수의 키워드를 포함할 수 있다. 이 경우, 해당 미디어를 포함하는 미디어 메시지는 복수의 키워드들 중 어느 하나에 대해 검색될 수 있다.Meanwhile, multiple keywords may be extracted for one image. For example, in the case of 'Labrador Retriever', the keyword "Labrador" and the keyword "Retriever" may each be extracted as keywords for one image. In this way, keywords of media may include multiple keywords. In this case, a media message containing the corresponding media may be searched for any one of a plurality of keywords.
한편, 각각의 머신러닝 모델은 입력되는 이미지나 오디오에 대해 기설정된 신뢰도 이상인 카테고리를 출력하도록 학습될 수 있다. 이러한 머신러닝 모델은 일례로, MLP(Multi-Layer Perceptron), DNN(Deep Neural Network), CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), G-CNN(Group Convolutional Neural Network), R-CNN(Recurrent Convolutional Neural Network) 등 다양한 알고리즘들 중 하나 이상이 활용될 수 있으며, 특정 알고리즘에 한정되는 것은 아니다. 또한, 각각의 머신러닝 모델은 이미지나 오디오를 분류하여 카테고리를 출력하도록 구현된 이미 잘 알려진 모델들 중 어느 하나를 활용할 수도 있다. 일례로, 이미지를 분류하기 위해서는 이미 잘 알려진 코어 머신러닝(CoreML(Core Machine Learning)) 프레임워크와 비전(Vision) 프레임워크가 활용될 수 있으며, 분류의 신뢰도가 70% 이상이면 분류의 식별자를 키워드로 간주할 수 있다. 또한, 오디오의 분류를 위해 이미 잘 알려진 사운드 분석 프레임워크(SoundAnalysis Framework)가 활용될 수 있다. 이미지의 분류와 유사하게 분류의 신뢰도가 70% 이상이면 분류의 식별자를 키워드로 간주할 수 있다.Meanwhile, each machine learning model can be trained to output a category that is higher than a preset reliability level for the input image or audio. Examples of these machine learning models include Multi-Layer Perceptron (MLP), Deep Neural Network (DNN), Convolutional Neural Network (CNN), Recurrent Neural Network (RNN), Group Convolutional Neural Network (G-CNN), and R-CNN. One or more of various algorithms such as (Recurrent Convolutional Neural Network) can be used, and it is not limited to a specific algorithm. Additionally, each machine learning model can utilize one of the well-known models implemented to classify images or audio and output categories. For example, to classify images, the well-known Core Machine Learning (Core Machine Learning) framework and Vision framework can be used, and if the confidence level of the classification is more than 70%, the identifier of the classification is used as a keyword. It can be regarded as Additionally, the well-known sound analysis framework (SoundAnalysis Framework) can be used to classify audio. Similar to the classification of images, if the reliability of the classification is more than 70%, the identifier of the classification can be considered a keyword.
도 4는 본 발명의 일실시예에 따른 미디어 메시지 검색 방법의 다른 예를 도시한 흐름도이다. 본 실시예에 따른 미디어 메시지 검색 방법은 인스턴트 메시징 서비스를 제공하는 서버를 구현하는 컴퓨터 장치(200)에 의해 수행될 수 있다. 이때, 컴퓨터 장치(200)의 프로세서(220)는 메모리(210)가 포함하는 운영체제의 코드나 적어도 하나의 컴퓨터 프로그램의 코드에 따른 제어 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 프로세서(220)는 컴퓨터 장치(200)에 저장된 코드가 제공하는 제어 명령에 따라 컴퓨터 장치(200)가 도 4의 방법이 포함하는 단계들(410 내지 440)을 수행하도록 컴퓨터 장치(200)를 제어할 수 있다.Figure 4 is a flowchart showing another example of a media message search method according to an embodiment of the present invention. The media message retrieval method according to this embodiment may be performed by the computer device 200 implementing a server providing an instant messaging service. At this time, the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program. Here, the processor 220 causes the computer device 200 to perform steps 410 to 440 included in the method of FIG. 4 according to control instructions provided by code stored in the computer device 200. can be controlled.
단계(410)에서 컴퓨터 장치(200)는 인스턴트 메시징 서비스의 특정 세션을 통해 미디어 메시지 및 미디어 메시지를 송신한 송신자측 단말기에 의해 추출된 미디어 메시지가 포함하는 미디어의 키워드를 수신할 수 있다. 여기서, 송신자측 단말기에 의해 추출되는 키워드는 앞서 도 3의 단계(320)에서 송신하고자 하는 미디어 메시지에 대해 추출된 미디어의 키워드일 수 있다. 송신자측 단말기는 미디어 메시지를 송신할 때, 미디어 메시지가 포함하는 미디어의 키워드를 추출한 후, 추출된 미디어의 키워드를 미디어 메시지와 함께 서버로 전송할 수 있다.In step 410, the computer device 200 may receive a media message and a keyword of the media included in the media message extracted by the sender's terminal that transmitted the media message through a specific session of the instant messaging service. Here, the keyword extracted by the sender's terminal may be a keyword of the media extracted for the media message to be transmitted in step 320 of FIG. 3. When transmitting a media message, the sender's terminal may extract the keywords of the media included in the media message and then transmit the extracted keywords of the media to the server along with the media message.
단계(420)에서 컴퓨터 장치(200)는 수신된 미디어의 키워드를 미디어 메시지와 연계하여 저장할 수 있다. 일례로, 컴퓨터 장치(200)는 수신된 미디어의 키워드를 수신된 미디어 메시지의 식별자와 연계하여 컴퓨터 장치(200)의 로컬 데이터베이스에 저장할 수 있다. 여기서 로컬 데이터베이스는 앞서 컴퓨터 장치(200)의 메모리(210)나 별도로 설명한 영구 저장 장치를 통해 구현될 수 있다.In step 420, the computer device 200 may store keywords of the received media in association with the media message. In one example, computer device 200 may store keywords of received media in a local database of computer device 200 in association with an identifier of the received media message. Here, the local database may be implemented through the memory 210 of the computer device 200 or a persistent storage device described separately.
단계(430)에서 컴퓨터 장치(200)는 수신된 미디어 메시지 및 미디어의 키워드를 특정 세션의 참가자들의 단말기로 전달할 수 있다. 이를 통해 하나의 미디어 메시지가 해당 미디어 메시지의 송신자측 단말기와 수신자측 단말기 모두에서 검색될 수 있다.In step 430, the computer device 200 may transmit the received media message and the keyword of the media to the terminals of participants of a specific session. Through this, one media message can be searched on both the sender's terminal and the receiver's terminal of the media message.
단계(440)에서 컴퓨터 장치(200)는 수신된 미디어의 키워드를 미디어와 관련된 타임라인 컨텐츠의 태그로서 등록할 수 있다. 서버는 인스턴트 메시징 서비스의 각 회원들을 위한 타임라인 서비스를 제공할 수 있다. 이때, 특정 미디어 메시지에 포함된 미디어가 타임라인 컨텐츠로서 타임라인 서비스에 등록되는 경우, 서버는 해당 미디어 메시지로부터 추출된 미디어의 키워드를 타임라인 컨텐츠의 태그로서 자동으로 등록하여 활용할 수 있다.In step 440, the computer device 200 may register a keyword of the received media as a tag of timeline content related to the media. The server may provide a timeline service for each member of the instant messaging service. At this time, when media included in a specific media message is registered in the timeline service as timeline content, the server can automatically register and utilize the keywords of the media extracted from the media message as tags of the timeline content.
도 5 내지 도 9는 본 발명의 일실시예에 있어서, 검색 인터페이스를 제공하는 예를 도시한 도면들이다.5 to 9 are diagrams illustrating an example of providing a search interface according to an embodiment of the present invention.
도 5의 실시예는 인스턴트 메시징 서비스의 특정 세션을 통해 송수신된 인스턴트 메시지들의 시퀀스 중 적어도 일부가 표시된 대화방 화면(510)의 예를 나타내고 있다. 대화방 화면(510)은 인스턴트 메시지들의 시퀀스 중 적어도 일부뿐만 아니라 다양한 사용자 인터페이스들을 포함할 수 있다. 이때, 본 실시예에 따른 대화방 화면(510)은 검색 인터페이스를 활성화시키기 위한 아이콘(520)이 표시될 수 있다. 아이콘(520)이 사용자에 의해 선택되는 경우(일례로, 터치스크린 환경에서 사용자에 의해 아이콘(520)이 표시된 영역에 터치입력이 인식되는 경우), 검색 인터페이스가 활성화될 수 있다.The embodiment of FIG. 5 shows an example of a chat room screen 510 on which at least part of a sequence of instant messages transmitted and received through a specific session of an instant messaging service is displayed. Chat room screen 510 may include various user interfaces as well as at least a portion of a sequence of instant messages. At this time, the chat room screen 510 according to this embodiment may display an icon 520 for activating the search interface. When the icon 520 is selected by the user (for example, when a touch input is recognized in the area where the icon 520 is displayed by the user in a touch screen environment), the search interface may be activated.
도 6의 실시예는 검색 인터페이스가 활성화된 대화방 화면(610)의 예를 나타내고 있다. 대화방 화면(610)은 검색 인터페이스로서 입력되는 키워드를 표시하기 위한 입력창 인터페이스(620)와 제1 점선박스(630)와 같이 키워드를 입력받기 위한 자판 인터페이스가 표시된 예를 나타내고 있다.The embodiment of FIG. 6 shows an example of a chat room screen 610 with the search interface activated. The chat room screen 610 shows an example of an input window interface 620 for displaying keywords input as a search interface and a keyboard interface for inputting keywords, such as the first dotted line box 630.
도 7의 실시예는 자판 인터페이스를 통해 키워드가 입력됨에 따라 입력창 인터페이스(620)에 입력된 키워드가 표시되고, 입력된 키워드에 대응하는 검색 결과의 리스트가 표시된 대화방 화면(710)의 예를 나타내고 있다. 이때, 제2 점선박스(720)는 대화방 화면(710)에 표시된 검색 결과의 리스트의 일부를 나타내고 있다. 한편, 사용자는 표시된 검색 결과 중 하나를 선택하여 선택된 검색 결과에 대응하는 인스턴트 메시지에 접근할 수 있게 된다. 검색 결과는 대화방 화면(710)에 나타난 바와 같이 텍스트 메시지 외에도 사진, 동영상 및/또는 오디오를 포함하는 미디어 메시지를 포함할 수 있음을 나타내고 있다. 여기서, 도 7의 실시예에 나타난 미디어 메시지들은 입력된 키워드 "고양이"와 연계하여 식별자가 해당 세션의 참여자의 단말기의 로컬 데이터베이스에 저장된 미디어 메시지들임을 쉽게 이해할 수 있을 것이다. 다시 말해, 사용자가 키워드 "고양이"를 입력함에 따라 사용자의 단말기는 로컬 데이터베이스에서 키워드 "고양이"와 연계하여 저장된 식별자를 통해 미디어 메시지들을 검색할 수 있다. 또한, 사용자의 단말기는 키워드 "고양이"를 포함하는 텍스트 메시지들을 검색할 수 있다. 검색된 미디어 메시지들과 텍스트 메시지들은 해당 세션에서 송수신된 인스턴트 메시지들의 시퀀스에 따라 정렬되어 검색 결과 리스트가 생성될 수 있다.The embodiment of FIG. 7 shows an example of a chat room screen 710 in which the input keyword is displayed in the input window interface 620 as the keyword is input through the keyboard interface, and a list of search results corresponding to the input keyword is displayed. there is. At this time, the second dotted box 720 represents part of the list of search results displayed on the chat room screen 710. Meanwhile, the user can select one of the displayed search results to access the instant message corresponding to the selected search result. As shown in the chat room screen 710, the search results indicate that in addition to text messages, they may include media messages including photos, videos, and/or audio. Here, it can be easily understood that the media messages shown in the embodiment of FIG. 7 are media messages whose identifiers are linked to the input keyword “cat” and are stored in the local database of the terminal of the participant of the session. In other words, as the user inputs the keyword “cat,” the user's terminal can search for media messages through the identifier stored in association with the keyword “cat” in the local database. Additionally, the user's terminal can search for text messages containing the keyword “cat.” The searched media messages and text messages can be sorted according to the sequence of instant messages sent and received in the session to generate a search result list.
도 8의 실시예는 대화방 화면(710)에서 사용자가 두 번째 검색 결과를 선택함에 따라 두 번째 검색 결과에 대응하는 인스턴트 메시지가 제공되는 대화방 화면(810)의 예를 나타내고 있다. 이때, 대화방 화면(810)에서는 해당 세션을 통해 송수신된 인스턴트 메시지들의 시퀀스 중 미디어 메시지 3(820)의 위치에 대응하는 부분을 표시하고 있다. 또한, 도 8의 실시예에서 제3 점선박스(830)는 이전 검색 결과를 표시하기 위한 제1 사용자 인터페이스를, 제4 점선박스(840)는 다음 검색 결과를 표시하기 위한 제2 사용자 인터페이스를 각각 나타내고 있다. 또한, 도 8의 실시예에서는 제5 점선박스(850)는 현재 표시되는 검색 결과가 전체 검색 결과 10개 중 2번째 검색 결과임을 나타내고 있다.The embodiment of FIG. 8 shows an example of a chat room screen 810 in which an instant message corresponding to the second search result is provided as the user selects the second search result in the chat room screen 710. At this time, the chat room screen 810 displays a portion corresponding to the location of media message 3 820 among the sequence of instant messages transmitted and received through the session. In addition, in the embodiment of FIG. 8, the third dotted box 830 serves as a first user interface for displaying previous search results, and the fourth dotted line box 840 represents a second user interface for displaying next search results. It is showing. Additionally, in the embodiment of FIG. 8, the fifth dotted box 850 indicates that the currently displayed search result is the second search result out of 10 total search results.
도 9의 실시예는 대화방 화면(810)에서 사용자가 제4 점선박스(840)를 통해 표시된 제2 사용자 인터페이스를 선택함에 따라 다음 검색 결과를 표시하는 대화방 화면(910)의 예를 나타내고 있다. 도 7의 실시예에서 설명한 바와 같이, 다음 검색 결과는 텍스트 "고양이가 예쁘네"를 포함하는 텍스트 메시지(텍스트 메시지 16(920))에 대응할 수 있으며, 사용자의 단말기는 해당 세션에서 송수신된 인스턴트 메시지들의 시퀀스 중에서 해당 텍스트 메시지(텍스트 메시지 16(920))의 위치에 대응하는 부분을 대화방 화면(910)에 표시할 수 있다.The embodiment of FIG. 9 shows an example of a chat room screen 910 that displays the next search result as the user selects the second user interface displayed through the fourth dotted line box 840 in the chat room screen 810. As described in the embodiment of FIG. 7, the next search result may correspond to a text message (text message 16 (920)) containing the text “The cat is pretty”, and the user's terminal may display instant messages sent and received in the session. The portion corresponding to the location of the text message (text message 16 (920)) in the sequence can be displayed on the chat room screen (910).
이하에서는 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출하여 미디어 메시지의 검색에 활용하는 구체적인 실시예들을 설명한다.Below, specific embodiments of extracting text from visual information included in a media message and using it to search for a media message will be described.
도 10은 본 발명의 일실시예에 있어서, 시각적 정보를 포함하는 미디어 메시지에 대한 검색 방법의 예를 도시한 흐름도이다. 본 실시예에 따른 미디어 메시지 검색 방법은 인스턴트 메시징 서비스를 이용하여 특정 세션에 참여하여 인스턴트 메시지를 전송하거나 및/또는 수신하는 단말기를 구현하는 컴퓨터 장치(200)에 의해 수행될 수 있다. 이때, 컴퓨터 장치(200)의 프로세서(220)는 메모리(210)가 포함하는 운영체제의 코드나 적어도 하나의 컴퓨터 프로그램의 코드에 따른 제어 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 프로세서(220)는 컴퓨터 장치(200)에 저장된 코드가 제공하는 제어 명령에 따라 컴퓨터 장치(200)가 도 10의 방법이 포함하는 단계들(1010 내지 1070)을 수행하도록 컴퓨터 장치(200)를 제어할 수 있다.Figure 10 is a flowchart showing an example of a search method for a media message containing visual information, according to an embodiment of the present invention. The media message search method according to this embodiment may be performed by the computer device 200 that implements a terminal that sends and/or receives instant messages by participating in a specific session using an instant messaging service. At this time, the processor 220 of the computer device 200 may be implemented to execute control instructions according to the code of an operating system included in the memory 210 or the code of at least one computer program. Here, the processor 220 causes the computer device 200 to perform steps 1010 to 1070 included in the method of FIG. 10 according to control instructions provided by code stored in the computer device 200. can be controlled.
단계(1010)에서 컴퓨터 장치(200)는 인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 특정 세션에 참여할 수 있다. 이미 설명한 바와 같이, 인스턴트 메시징 서비스의 세션은 특정 대화방에 대응될 수 있다. 해당 세션을 통해 송수신된 인스턴트 메시지들의 시퀀스가 대응하는 대화방을 통해 해당 세션의 참여자들에게 제공될 수 있다. 일례로, 상술한 적어도 하나의 컴퓨터 프로그램은 인스턴트 메시징 서비스와 연계된 어플리케이션일 수 있으며, 컴퓨터 장치(200)는 적어도 하나의 프로세서(일례로, 프로세서(220))에 의해, 어플리케이션의 제어에 따라 인스턴트 메시징 서비스를 제공하는 서버에 접근하여 특정 세션을 생성하거나 또는 이미 생성되어 있는 특정 세션에 참여할 수 있다.In step 1010, the computer device 200 may create a specific session of an instant messaging service or participate in a specific session. As already described, a session of an instant messaging service may correspond to a specific chat room. A sequence of instant messages sent and received through the session may be provided to participants of the session through a corresponding chat room. For example, the at least one computer program described above may be an application associated with an instant messaging service, and the computer device 200 is configured to provide instant messaging under the control of the application by at least one processor (e.g., processor 220). You can access a server that provides messaging services to create a specific session or participate in a specific session that has already been created.
단계(1020)에서 컴퓨터 장치(200)는 특정 세션을 통해 컴퓨터 장치(200)에서 송신하고자 하는 미디어 메시지 또는 특정 세션을 통해 컴퓨터 장치(200)로 수신된 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출할 수 있다.In step 1020, the computer device 200 extracts text from a media message desired to be transmitted from the computer device 200 through a specific session or visual information included in a media message received to the computer device 200 through a specific session. can do.
이미 설명한 바와 같이 텍스트의 추출을 위해 비전(vision) 기반의 머신러닝이 활용될 수 있다. 컴퓨터 장치(200)는 머신러닝 모델을 직접 포함할 수도 있으나, 비전 기반의 머신러닝 서비스를 제공하는 서버에 대한 API(Application Programming interface) 호출에 기초하여 해당 서버가 제공하는 머신러닝 서비스를 제공받을 수 있다. 이 경우, 컴퓨터 장치(200)는 시각적 정보로서의 이미지 및/또는 동영상으로부터 추출되는 썸네일(thumbnail)을 머신러닝 모듈(컴퓨터 장치(200)가 포함하거나 또는 서버가 포함하는 머신러닝 모듈)의 입력으로 활용하여 텍스트를 추출할 수 있다.As already explained, vision-based machine learning can be used to extract text. The computer device 200 may directly include a machine learning model, but may receive a machine learning service provided by the server based on an API (Application Programming Interface) call to the server providing the vision-based machine learning service. there is. In this case, the computer device 200 uses a thumbnail extracted from an image and/or video as visual information as an input to a machine learning module (a machine learning module included in the computer device 200 or included in the server). You can extract text.
한편, 일례로 컴퓨터 장치(200)는 시각적 정보가 포함하는 텍스트를 추출할 수 있다. 보다 구체적인 예로, 컴퓨터 장치(200)는 사진이나 동영상 속의 텍스트를 인식하여 인식된 텍스트를 추출할 수 있다. 이때 컴퓨터 장치(200)는 문장 단위의 텍스트를 추출할 수 있으나, 이에 한정되는 것은 아니다.Meanwhile, as an example, the computer device 200 may extract text included in visual information. As a more specific example, the computer device 200 may recognize text in a photo or video and extract the recognized text. At this time, the computer device 200 can extract text in sentence units, but is not limited to this.
다른 예로, 컴퓨터 장치(200)는 시각적 정보가 분류되는 카테고리에 대한 텍스트를 추출할 수 있다. 보다 구체적인 예로, 컴퓨터 장치(200)는 사람이 많이 존재하는 사진의 카테고리가 "person"으로 분류된 경우, 이러한 카테고리 "person"을 텍스트로서 추출할 수 있다.As another example, the computer device 200 may extract text for a category into which visual information is classified. As a more specific example, if the category of a photo in which many people exist is classified as “person,” the computer device 200 may extract the category “person” as text.
또 다른 예로, 컴퓨터 장치(200)는 시각적 정보가 포함하는 텍스트가 분류되는 포맷에 대한 텍스트를 추출할 수 있다. 이때, 포맷은 전화번호 포맷, 이메일 주소 포맷, 계좌번호 포맷, 가격 포맷 및 명함 포맷 중 적어도 하나를 포함할 수 있다. 보다 구체적인 예로, 사진 속에 "010-1234-5678"과 같은 전화번호가 포함된 경우, 컴퓨터 장치(200)는 사진으로부터 "010-1234-5678"가 아닌 "전화번호"와 같이 포맷에 대한 텍스트를 추출할 수 있다.As another example, the computer device 200 may extract text for a format in which text included in visual information is classified. At this time, the format may include at least one of a phone number format, an email address format, an account number format, a price format, and a business card format. As a more specific example, if a phone number such as “010-1234-5678” is included in the photo, the computer device 200 extracts text for formatting from the photo, such as “Phone Number” rather than “010-1234-5678”. It can be extracted.
또한, 컴퓨터 장치(200)는 상술한 예시들 중 둘 이상의 예시에 따른 텍스트를 추출할 수도 있다. 예를 들어, 사진 속에 "010-1234-5678"과 같은 전화번호가 포함된 경우, 컴퓨터 장치(200)는 사진 속에 포함된 텍스트 "010-1234-5678"와 텍스트 "010-1234-5678"의 포맷에 대한 텍스트 "전화번호"를 모두 추출하여 활용할 수도 있다. 다른 예로, 텍스트 "ABCDE"와 사람이 많이 존재하는 사진으로부터 사진 속 텍스트 "ABCDE"와 카테고리에 대한 텍스트 "person"을 모두 추출하여 활용할 수도 있다. 다시 말해, 하나의 미디어 메시지로부터 복수의 텍스트 집합들이 추출될 수도 있다.Additionally, the computer device 200 may extract text according to two or more of the above-described examples. For example, if a phone number such as “010-1234-5678” is included in the photo, the computer device 200 may display the text “010-1234-5678” and the text “010-1234-5678” included in the photo. You can also extract and utilize all of the text “Phone Number” for the format. As another example, from a photo containing the text "ABCDE" and many people, both the text "ABCDE" in the photo and the text "person" for the category can be extracted and utilized. In other words, multiple text sets may be extracted from one media message.
단계(1030)에서 컴퓨터 장치(200)는 추출된 텍스트를 대응하는 미디어 메시지와 연계하여 컴퓨터 장치(200)의 로컬 데이터베이스에 저장할 수 있다. 개인정보 보호를 위해 추출된 텍스트는 기본적으로 인스턴트 메시징 서비스를 제공하는 서버에 저장되지 않을 수 있다. 다만 앞서 설명한 실시예들에서와 같이 인스턴트 메시징 서비스를 제공하는 서버가 텍스트를 키워드와의 매칭을 위해 다른 사용자에게 제공하고자 서버상에 임시로 저장할 수도 있다.In step 1030, the computer device 200 may store the extracted text in a local database of the computer device 200 in association with the corresponding media message. To protect personal information, extracted text may not be stored on servers that provide instant messaging services. However, as in the previously described embodiments, the server providing the instant messaging service may temporarily store the text on the server to provide it to other users for matching with keywords.
단계(1040)에서 컴퓨터 장치(200)는 인스턴트 메시징 서비스와 연계하여 검색 인터페이스를 제공할 수 있다. 이미 설명한 바와 같이 검색 인터페이스는 일례로 사용자로부터 키워드를 입력받기 위한 사용자 인터페이스를 포함할 수 있으나, 실시예에 따라 사용자로부터 키워드나 카테고리 등을 선택받기 위한 사용자 인터페이스를 포함할 수도 있다.In step 1040, the computer device 200 may provide a search interface in connection with an instant messaging service. As already described, the search interface may include, for example, a user interface for receiving a keyword from the user, but depending on the embodiment, it may also include a user interface for receiving a keyword or category from the user.
단계(1050)에서 컴퓨터 장치(200)는 로컬 데이터베이스에서 검색 인터페이스를 통해 입력된 키워드와 연관된 텍스트를 및 텍스트와 연계된 미디어 메시지를 검색할 수 있다. 일례로, 로컬 데이터베이스에는 텍스트, 그리고 해당 텍스트가 추출된 시각적 정보를 포함하는 미디어 메시지의 식별자가 서로 연계되어 저장될 수 있다. 이 경우, 컴퓨터 장치(200)는 검색 인터페이스를 통해 입력된 키워드를 포함하는 텍스트를 로컬 데이터베이스에서 검색한 후, 해당 텍스트와 연계된 미디어 메시지의 식별자를 로컬 데이터베이스에서 추출함으로써 텍스트와 미디어 메시지를 검색할 수 있다. In step 1050, the computer device 200 may search a local database for text associated with a keyword entered through a search interface and media messages associated with the text. For example, in a local database, the text and the identifier of the media message including the visual information from which the text was extracted may be stored in association with each other. In this case, the computer device 200 searches the local database for text containing the keyword entered through the search interface and then extracts the identifier of the media message associated with the text from the local database to search for text and media messages. You can.
단계(1060)에서 컴퓨터 장치(200)는 검색된 미디어 메시지를 제공할 수 있다. 일례로, 컴퓨터 장치(200)는 키워드를 이용하여 로컬 데이터베이스에서 검색된 텍스트 및 미디어 메시지에 대한 검색 결과 리스트를 제공할 수 있다. 이때, 검색 결과 리스트에서 특정 검색 결과가 선택되는 경우, 컴퓨터 장치(200)는 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서, 검색 결과 리스트에서 선택된 검색 결과에 대응하는 인스턴트 메시지의 위치에 대응하는 부분이 표시되도록 인스턴트 메시지를 제공할 수 있다. 다른 예로, 컴퓨터 장치(200)는 검색 결과 리스트를 제공하지 않고 바로, 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서 검색된 미디어 메시지의 위치에 대응하는 부분을 표시하여 검색된 미디어 메시지를 제공할 수도 있다.In step 1060, the computer device 200 may provide the retrieved media message. For example, the computer device 200 may provide a search result list for text and media messages searched in a local database using keywords. At this time, when a specific search result is selected from the search result list, the computer device 200 selects a portion corresponding to the location of the instant message corresponding to the search result selected from the search result list in the sequence of instant messages transmitted and received through the specific session. You can provide an instant message to be displayed. As another example, the computer device 200 may provide the searched media message by displaying a portion corresponding to the location of the searched media message in a sequence of instant messages transmitted and received through a specific session without providing a search result list.
단계(1070)에서 컴퓨터 장치(200)는 추출된 텍스트를 시각적 정보를 위한 타임라인 태그로 등록할 수 있다. 인스턴트 메시징 서비스의 세션을 통해 송수신된 미디어 메시지의 시각적 정보는 특정 사용자 계정과 연계된 타임라인상의 게시물로 업로드될 수도 있다. 이 경우, 컴퓨터 장치(200)는 타임라인상의 게시물을 통해 업로드되는 시각적 정보를 위한 타임라인 태그로서 앞서 시각적 정보로부터 추출된 텍스트를 자동 등록할 수 있다. In step 1070, the computer device 200 may register the extracted text as a timeline tag for visual information. Visual information in media messages sent and received through a session of an instant messaging service may be uploaded as a post on a timeline associated with a specific user account. In this case, the computer device 200 may automatically register text previously extracted from visual information as a timeline tag for visual information uploaded through a post on the timeline.
도 11은 본 발명의 일실시예에 있어서, 시각적 정보의 실제 예시와 시각적 정보로부터 추출될 수 있는 텍스트의 예시를 도시한 도면이다. 도 11은 시각적 정보의 예시로서 준비된 사진(1100)과 사진(1100)으로부터 추출된 텍스트들의 예시를 나타내고 있다. 사진(1100)은 비전 기반의 머신러닝 모듈로 입력될 수 있고, 머신러닝 모듈은 사진(1100)의 카테고리를 "person"으로 분류할 수 있다. 이 경우, 카테고리에 대한 텍스트 "person"이 시각적 정보에 대한 제1 텍스트로서 추출될 수 있다. 또한, 머신러닝 모듈은 사진(1100)이 포함하고 있는 텍스트인 "#CLEANUPCOVID", "Be A Good Neighbour" 및 "Pick Up After"를 제2 텍스트, 제3 텍스트 및 제4 텍스트로서 각각 추출할 수 있다. 이 경우, 제1 내지 제4 텍스트가 시각적 정보인 사진(1100) 및/또는 사진(1100)의 식별자와 연계하여 컴퓨터 장치(200)의 로컬 데이터베이스에 저장될 수 있다. 만약, 시각적 정보가 포함하는 텍스트가 전화번호나 계좌번호 등과 같이 특정한 포맷을 가진 텍스트인 경우, 해당 포맷에 대한 "전화번호"나 "계좌번호"와 같은 텍스트가 추출될 수도 있다.Figure 11 is a diagram showing an actual example of visual information and an example of text that can be extracted from visual information, according to an embodiment of the present invention. FIG. 11 shows an example of a photo 1100 prepared as an example of visual information and texts extracted from the photo 1100. The photo 1100 can be input into a vision-based machine learning module, and the machine learning module can classify the category of the photo 1100 as “person.” In this case, the text “person” for the category may be extracted as the first text for the visual information. In addition, the machine learning module can extract the texts included in the photo 1100, “#CLEANUPCOVID”, “Be A Good Neighbor”, and “Pick Up After”, as the second text, third text, and fourth text, respectively. there is. In this case, the first to fourth texts may be stored in the local database of the computer device 200 in connection with the photo 1100 and/or the identifier of the photo 1100, which is visual information. If the text included in the visual information is text with a specific format, such as a phone number or account number, text such as “phone number” or “account number” for that format may be extracted.
도 12는 본 발명의 일실시예에 있어서, 미디어 메시지를 검색하는 예를 도시한 도면이다. 도 12는 입력되는 키워드를 표시하기 위한 검색 인터페이스로서의 입력창 인터페이스(1210)를 통해 키워드 "Up"이 입력됨에 따라 키워드 "Up"을 포함하는 텍스트 메시지에 대한 검색 결과(1220)뿐만 아니라, 키워드 "Up"을 포함하는 텍스트가 포함된 미디어 메시지에 대한 검색 결과들(1230)도 포함하는 검색 결과 리스트가 표시된 예를 나타내고 있다.Figure 12 is a diagram illustrating an example of searching for a media message according to an embodiment of the present invention. 12 shows not only a search result 1220 for a text message including the keyword "Up" as the keyword "Up" is input through the input window interface 1210 as a search interface for displaying the input keyword, but also the keyword "Up". This shows an example in which a search result list including search results 1230 for media messages containing text including “Up” is displayed.
도 13은 본 발명의 일실시예에 있어서, 미디어 메시지를 검색하는 다른 예를 도시한 도면이다. 도 13은 입력되는 키워드를 표시하기 위한 검색 인터페이스로서의 입력창 인터페이스(1310)를 통해 키워드 "Perso"이 입력됨에 따라 키워드 "Perso"을 포함하는 텍스트가 포함된 미디어 메시지에 대한 검색 결과(1320)도 포함하는 검색 결과 리스트가 표시된 예를 나타내고 있다.Figure 13 is a diagram illustrating another example of searching for a media message according to an embodiment of the present invention. 13 shows a search result 1320 for a media message containing text including the keyword "Perso" as the keyword "Perso" is entered through the input window interface 1310 as a search interface for displaying the input keyword. This shows an example in which a list of search results containing the text is displayed.
이때, 도 12 또는 도 13에 나타난 검색 결과 리스트에서 사용자가 특정 검색 결과를 선택하는 경우, 선택된 검색 결과에 대응하는 미디어 메시지가 사용자에게 제공될 수 있다. 미디어 메시지는 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스 중 해당 미디어 메시지의 위치에 대응하는 부분을 표시함으로써 사용자에게 제공될 수 있으나, 이에 한정되는 것은 아니다. 단순히 해당 미디어 메시지만을 별도로 표시하여 사용자에게 선택된 검색 결과의 미디어 메시지를 제공할 수도 있다.At this time, when the user selects a specific search result from the search result list shown in FIG. 12 or 13, a media message corresponding to the selected search result may be provided to the user. A media message may be provided to a user by displaying a portion corresponding to the location of the media message among a sequence of instant messages transmitted and received through a specific session, but the present invention is not limited to this. The media message of the selected search result may be provided to the user by simply displaying the corresponding media message separately.
이처럼, 사용자는 시각적 정보를 포함하는 미디어 메시지를 시각적 정보가 포함하는 텍스트뿐만 아니라, 이러한 텍스트의 포맷 및/또는 시각적 정보의 카테고리(또는 주제, 장르 등)를 통해서도 검색하는 것이 가능해진다.In this way, users can search for media messages containing visual information not only through the text containing the visual information, but also through the format of the text and/or the category (or topic, genre, etc.) of the visual information.
이처럼, 본 발명의 실시예들에 따르면, 인스턴트 메시징 서비스의 특정 세션을 통해 송수신된 메시지에 포함된 시각적 정보를 분석하여 텍스트를 추출하고, 추출된 시각적 정보의 텍스트를 활용하여 해당 시각적 정보를 검색할 수 있다.As such, according to embodiments of the present invention, text is extracted by analyzing visual information included in a message transmitted and received through a specific session of an instant messaging service, and the text of the extracted visual information is used to search for the visual information. You can.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The system or device described above may be implemented with hardware components or a combination of hardware components and software components. For example, devices and components described in embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), etc. , may be implemented using one or more general-purpose or special-purpose computers, such as a programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. Additionally, a processing device may access, store, manipulate, process, and generate data in response to the execution of software. For ease of understanding, a single processing device may be described as being used; however, those skilled in the art will understand that a processing device includes multiple processing elements and/or multiple types of processing elements. It can be seen that it may include. For example, a processing device may include a plurality of processors or one processor and one controller. Additionally, other processing configurations, such as parallel processors, are possible.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing unit to operate as desired, or may be processed independently or collectively. You can command the device. Software and/or data may be used on any type of machine, component, physical device, virtual equipment, computer storage medium or device to be interpreted by or to provide instructions or data to a processing device. It can be embodied in . Software may be distributed over networked computer systems and thus stored or executed in a distributed manner. Software and data may be stored on one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination. The medium may continuously store a computer-executable program, or may temporarily store it for execution or download. In addition, the medium may be a variety of recording or storage means in the form of a single or several pieces of hardware combined. It is not limited to a medium directly connected to a computer system and may be distributed over a network. Examples of media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, And there may be something configured to store program instructions, including ROM, RAM, flash memory, etc. Additionally, examples of other media include recording or storage media managed by app stores that distribute applications, sites that supply or distribute various other software, or servers. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques are performed in a different order than the described method, and/or components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or other components are used. Alternatively, appropriate results may be achieved even if substituted or substituted by an equivalent.
그러므로, 다른 구현들, 다른 실시예들 및 청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.Therefore, other implementations, other embodiments and equivalents of the claims also fall within the scope of the following claims.

Claims (20)

  1. 컴퓨터 장치와 결합되어 미디어 메시지 검색 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램에 있어서,A computer program coupled to a computer device and stored on a computer-readable recording medium for executing a media message retrieval method on the computer device, comprising:
    상기 미디어 메시지 검색 방법은,The media message search method is:
    인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 상기 특정 세션에 참여하는 단계;creating or participating in a specific session of an instant messaging service;
    상기 특정 세션을 통해 상기 컴퓨터 장치에서 송신하고자 하는 미디어 메시지 또는 상기 특정 세션을 통해 상기 컴퓨터 장치로 수신된 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출하는 단계;extracting text from visual information included in a media message to be transmitted from the computer device through the specific session or a media message received by the computer device through the specific session;
    상기 추출된 텍스트를 대응하는 미디어 메시지와 연계하여 상기 컴퓨터 장치의 로컬 데이터베이스에 저장하는 단계;storing the extracted text in a local database of the computer device in association with a corresponding media message;
    상기 인스턴트 메시징 서비스와 연계하여 검색 인터페이스를 제공하는 단계; 및 providing a search interface in conjunction with the instant messaging service; and
    상기 로컬 데이터베이스에서 상기 검색 인터페이스를 통해 입력된 키워드와 연관된 텍스트를 및 상기 텍스트와 연계된 미디어 메시지를 검색하는 단계Searching the local database for a text associated with a keyword entered through the search interface and a media message associated with the text.
    를 포함하는 것containing
    을 특징으로 하는 컴퓨터 프로그램.A computer program characterized by .
  2. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 텍스트를 추출하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program, characterized in that extracting text included in the visual information.
  3. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 분류되는 카테고리에 대한 텍스트를 추출하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program characterized in that it extracts text for a category into which the visual information is classified.
  4. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 텍스트가 분류되는 포맷에 대한 텍스트를 추출하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program, characterized in that extracting text in a format in which the text included in the visual information is classified.
  5. 제4항에 있어서,According to clause 4,
    상기 포맷은 전화번호 포맷, 이메일 주소 포맷, 계좌번호 포맷, 가격 포맷 및 명함 포맷 중 적어도 하나를 포함하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program characterized in that the format includes at least one of a phone number format, an email address format, an account number format, a price format, and a business card format.
  6. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 문장 단위의 텍스트를 추출하고,Extract sentence-level text included in the visual information,
    상기 미디어 메시지를 검색하는 단계는,The step of retrieving the media message is,
    상기 키워드를 포함하는 문장 단위의 텍스트 및 상기 문장 단위의 텍스트와 연계된 미디어 메시지를 검색하는 것Searching for text in sentence units containing the keyword and media messages linked to the text in sentence unit.
    을 특징으로 하는 컴퓨터 프로그램.A computer program characterized by .
  7. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    비전(vision) 기반의 머신러닝에 기초하여 상기 시각적 정보로부터 텍스트를 추출하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program characterized by extracting text from the visual information based on vision-based machine learning.
  8. 제1항에 있어서,According to paragraph 1,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    비전 기반의 머신러닝 서비스를 제공하는 서버에 대한 API(Application Programming interface) 호출에 기초하여 상기 서버가 제공하는 머신러닝 서비스를 통해 상기 시각적 정보로부터 텍스트를 추출하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program characterized in that it extracts text from the visual information through a machine learning service provided by the server based on an API (Application Programming Interface) call to a server that provides a vision-based machine learning service.
  9. 제1항에 있어서,According to paragraph 1,
    상기 추출된 텍스트가 상기 인스턴트 메시징 서비스를 제공하는 서버에 저장되지 않는 것을 특징으로 하는 컴퓨터 프로그램.A computer program, wherein the extracted text is not stored on a server providing the instant messaging service.
  10. 제1항에 있어서,According to paragraph 1,
    상기 시각적 정보는 이미지 및 동영상 중 적어도 하나를 포함하고,The visual information includes at least one of an image and a video,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 이미지 또는 동영상으로부터 추출되는 썸네일(thumbnail)을 머신러닝 모듈의 입력으로 활용하여 상기 텍스트를 추출하는 것Extracting the text by using the thumbnail extracted from the image or video as input to the machine learning module.
    을 특징으로 하는 컴퓨터 프로그램.A computer program characterized by .
  11. 제1항에 있어서,According to paragraph 1,
    상기 미디어 메시지 검색 방법은,The media message search method is,
    상기 검색된 미디어 메시지를 제공하는 단계Providing the retrieved media message
    를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program further comprising:
  12. 제11항에 있어서,According to clause 11,
    상기 검색된 미디어 메시지를 제공하는 단계는,The step of providing the retrieved media message is,
    상기 키워드를 이용하여 상기 로컬 데이터베이스에서 검색된 텍스트 및 미디어 메시지에 대한 검색 결과 리스트를 제공하는 단계; 및providing a search result list for text and media messages searched in the local database using the keywords; and
    상기 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서, 상기 검색 결과 리스트에서 선택된 검색 결과에 대응하는 인스턴트 메시지의 위치에 대응하는 부분이 표시되도록 인스턴트 메시지를 제공하는 단계Providing an instant message so that in the sequence of instant messages transmitted and received through the specific session, a portion corresponding to the position of the instant message corresponding to the search result selected from the search result list is displayed.
    를 포함하는 것을 특징으로 하는 컴퓨터 프로그램. A computer program comprising:
  13. 제11항에 있어서,According to clause 11,
    상기 검색된 미디어 메시지를 제공하는 단계는,The step of providing the retrieved media message is,
    상기 특정 세션을 통해 송수신된 인스턴트 메시지의 시퀀스에서 상기 검색된 미디어 메시지의 위치에 대응하는 부분을 표시하여 상기 검색된 미디어 메시지를 제공하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program, characterized in that it provides the searched media message by displaying a portion corresponding to the location of the searched media message in the sequence of instant messages transmitted and received through the specific session.
  14. 제1항에 있어서,According to paragraph 1,
    상기 미디어 메시지 검색 방법은,The media message search method is,
    상기 추출된 텍스트를 상기 시각적 정보를 위한 타임라인 태그로 등록하는 단계Registering the extracted text as a timeline tag for the visual information
    를 더 포함하는 것을 특징으로 하는 컴퓨터 프로그램.A computer program further comprising:
  15. 적어도 하나의 프로세서를 포함하는 컴퓨터 장치의 미디어 메시지 검색 방법에 있어서,A method for retrieving a media message in a computer device including at least one processor, comprising:
    상기 적어도 하나의 프로세서에 의해, 인스턴트 메시징 서비스의 특정 세션을 생성하거나 또는 상기 특정 세션에 참여하는 단계;creating, by the at least one processor, a specific session of an instant messaging service or joining the specific session;
    상기 적어도 하나의 프로세서에 의해, 상기 특정 세션을 통해 상기 컴퓨터 장치에서 송신하고자 하는 미디어 메시지 또는 상기 특정 세션을 통해 상기 컴퓨터 장치로 수신된 미디어 메시지가 포함하는 시각적 정보로부터 텍스트를 추출하는 단계;extracting, by the at least one processor, text from visual information included in a media message to be transmitted from the computer device through the specific session or a media message received from the computer device through the specific session;
    상기 적어도 하나의 프로세서에 의해, 상기 추출된 텍스트를 대응하는 미디어 메시지와 연계하여 상기 컴퓨터 장치의 로컬 데이터베이스에 저장하는 단계;storing, by the at least one processor, the extracted text in association with a corresponding media message in a local database of the computer device;
    상기 적어도 하나의 프로세서에 의해, 상기 인스턴트 메시징 서비스와 연계하여 검색 인터페이스를 제공하는 단계; 및 providing, by the at least one processor, a search interface in conjunction with the instant messaging service; and
    상기 적어도 하나의 프로세서에 의해, 상기 로컬 데이터베이스에서 상기 검색 인터페이스를 통해 입력된 키워드와 연관된 텍스트를 및 상기 텍스트와 연계된 미디어 메시지를 검색하는 단계Searching, by the at least one processor, a text associated with a keyword entered through the search interface and a media message associated with the text in the local database.
    를 포함하는 미디어 메시지 검색 방법.Method for retrieving media messages containing .
  16. 제15항에 있어서,According to clause 15,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 텍스트를 추출하는 것을 특징으로 하는 미디어 메시지 검색 방법.A media message search method comprising extracting text included in the visual information.
  17. 제15항에 있어서,According to clause 15,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 분류되는 카테고리에 대한 텍스트를 추출하는 것을 특징으로 하는 미디어 메시지 검색 방법.A media message search method characterized by extracting text for a category into which the visual information is classified.
  18. 제15항에 있어서,According to clause 15,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 텍스트가 분류되는 포맷에 대한 텍스트를 추출하는 것을 특징으로 하는 미디어 메시지 검색 방법.A media message search method, characterized in that extracting text in a format in which the text included in the visual information is classified.
  19. 제15항에 있어서,According to clause 15,
    상기 텍스트를 추출하는 단계는,The step of extracting the text is,
    상기 시각적 정보가 포함하는 문장 단위의 텍스트를 추출하고,Extract sentence-level text included in the visual information,
    상기 미디어 메시지를 검색하는 단계는,The step of retrieving the media message is,
    상기 키워드를 포함하는 문장 단위의 텍스트 및 상기 문장 단위의 텍스트와 연계된 미디어 메시지를 검색하는 것Searching for text in sentence units containing the keyword and media messages linked to the text in sentence unit.
    을 특징으로 하는 미디어 메시지 검색 방법.A media message search method featuring:
  20. 제15항 내지 제19항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위한 컴퓨터 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체.A computer-readable recording medium recording a computer program for executing the method of any one of claims 15 to 19 on a computer device.
PCT/KR2023/015308 2022-11-08 2023-10-05 Method and system for searching for media message by using text extracted from media file WO2024101667A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220148046A KR20240066808A (en) 2022-11-08 Method and system for searching media message using text extracted from media file
KR10-2022-0148046 2022-11-08

Publications (1)

Publication Number Publication Date
WO2024101667A1 true WO2024101667A1 (en) 2024-05-16

Family

ID=91032651

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/015308 WO2024101667A1 (en) 2022-11-08 2023-10-05 Method and system for searching for media message by using text extracted from media file

Country Status (1)

Country Link
WO (1) WO2024101667A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140052794A (en) * 2012-10-21 2014-05-07 에스케이플래닛 주식회사 A recording medium for control of messenger, apparatus and system for the same
KR20170110671A (en) * 2015-02-04 2017-10-11 알리바바 그룹 홀딩 리미티드 Method and device for storing chat history of instant messaging
KR20190143083A (en) * 2018-06-20 2019-12-30 라인플러스 주식회사 Method, system, and non-transitory computer readable record medium for filtering image using keyword extracted form image
KR20200014108A (en) * 2018-07-31 2020-02-10 라인플러스 주식회사 Method, system, and non-transitory computer readable record medium for searching non-text using text in conversation
KR20210083578A (en) * 2019-12-27 2021-07-07 라인플러스 주식회사 Method, system, and computer program for providing experience that consumes video and comment at the same time

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140052794A (en) * 2012-10-21 2014-05-07 에스케이플래닛 주식회사 A recording medium for control of messenger, apparatus and system for the same
KR20170110671A (en) * 2015-02-04 2017-10-11 알리바바 그룹 홀딩 리미티드 Method and device for storing chat history of instant messaging
KR20190143083A (en) * 2018-06-20 2019-12-30 라인플러스 주식회사 Method, system, and non-transitory computer readable record medium for filtering image using keyword extracted form image
KR20200014108A (en) * 2018-07-31 2020-02-10 라인플러스 주식회사 Method, system, and non-transitory computer readable record medium for searching non-text using text in conversation
KR20210083578A (en) * 2019-12-27 2021-07-07 라인플러스 주식회사 Method, system, and computer program for providing experience that consumes video and comment at the same time

Similar Documents

Publication Publication Date Title
WO2022078102A1 (en) Entity identification method and apparatus, device and storage medium
WO2018074716A1 (en) Method and system for recommending query by using search context
CN107368508B (en) Keyword search method and system using communication tool service
WO2020204406A1 (en) Method and system for learning and enabling commands via user demonstration
WO2022052749A1 (en) Message processing method, apparatus and device, and storage medium
WO2020096087A1 (en) Method, system, and non-transitory computer-readable recording medium for managing message group
WO2017222087A1 (en) Chat contents search method and system
WO2016129811A1 (en) Method and system for providing rich menu in instant messaging service and recording medium
WO2018174314A1 (en) Method and system for producing story video
US20210043207A1 (en) Session message processing
WO2020166883A1 (en) Method and system for editing video on basis of context obtained using artificial intelligence
WO2018030554A1 (en) Method and system for providing message-based notification
WO2016126018A1 (en) Method, system, and recording medium for managing conversation contents in messenger
JP7335109B2 (en) A method, system, and non-transitory computer-readable recording medium for searching non-text using text from conversation content
KR20210050166A (en) Method for recognizing and utilizing user face based on profile picture in chat room created using group album
WO2019132066A1 (en) Method and system for providing multiple profiles
KR20200113750A (en) Method and system for presenting conversation thread
KR20200043659A (en) Method, system, and non-transitory computer readable record medium for collecting unreplied message
WO2017160133A2 (en) Method for configuring ranking of posts and service server therefor
WO2014058153A1 (en) Address book information service system, and method and device for address book information service therein
WO2015102125A1 (en) Text message conversation system and method
WO2014014229A1 (en) System for providing contact number information having added search function, and method for same
WO2024101667A1 (en) Method and system for searching for media message by using text extracted from media file
WO2018056653A1 (en) Method, apparatus and computer program for providing image together with translation
JP2022083404A (en) Search method, computer program, and computer equipment