JP7158564B2 - Information processing device, server device, user device and information processing system - Google Patents

Information processing device, server device, user device and information processing system Download PDF

Info

Publication number
JP7158564B2
JP7158564B2 JP2021508748A JP2021508748A JP7158564B2 JP 7158564 B2 JP7158564 B2 JP 7158564B2 JP 2021508748 A JP2021508748 A JP 2021508748A JP 2021508748 A JP2021508748 A JP 2021508748A JP 7158564 B2 JP7158564 B2 JP 7158564B2
Authority
JP
Japan
Prior art keywords
unit
information
processing
degree
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021508748A
Other languages
Japanese (ja)
Other versions
JPWO2020194925A1 (en
Inventor
彰 田中
誠 村▲崎▼
充弘 小形
広樹 石塚
昇悟 池田
翔 七尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JPWO2020194925A1 publication Critical patent/JPWO2020194925A1/ja
Application granted granted Critical
Publication of JP7158564B2 publication Critical patent/JP7158564B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、情報処理装置、サーバ装置、ユーザ装置及び情報処理システムに関する。 The present invention relates to an information processing device, a server device, a user device and an information processing system.

特許文献1には、表示部に表示されるコンテンツをキーワードに変換し、ユーザの行動履歴に基づいてキーワードを絞り込み、絞り込んだキーワードに関する情報を表示させるためのアイコンを生成する技術が開示されている。また、特許文献2には、ユーザの行動履歴に基づいて、ユーザの関心のある物体の特徴量を特定し、特定した特徴量を用いて、表示される物体の画像を絞り込み、絞り込んだ物体の画像に対してコメントを行う技術が開示されている。 Patent Literature 1 discloses a technique of converting content displayed on a display unit into keywords, narrowing down the keywords based on a user's action history, and generating an icon for displaying information about the narrowed down keywords. . In addition, in Patent Document 2, based on the user's action history, a feature amount of an object of interest to the user is specified, and using the specified feature amount, the image of the object to be displayed is narrowed down, and the narrowed down object image is displayed. A technique for commenting on an image has been disclosed.

特開2015―154195号公報JP 2015-154195 A 特開2014-16882号公報JP 2014-16882 A

従来の技術では、キーワードの絞り込み処理と物体の画像の絞り込み処理の各々にかかる処理負荷をどのように分散するかについて開示されていなかった。 The prior art does not disclose how to distribute the processing load applied to each of the keyword narrowing process and the object image narrowing process.

以上の課題を解決するために、本発明の好適な態様に係る情報処理装置は、ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の物体の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部と、前記行動情報と第2の絞り込みの程度に基づいて、コメントの対象となる一又は複数の対象キーワードを前記キーワード生成部によって生成された複数の候補キーワードから特定する特定部と、前記一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを生成するコメント生成部と、前記第1の絞り込みの程度と前記第2の絞り込みの程度とを、前記キーワード生成部及び前記特定部の処理に関する処理情報に応じて調整する調整部とを備える。 In order to solve the above problems, an information processing apparatus according to a preferred aspect of the present invention extracts images of a plurality of objects from a moving image based on action information indicating a user's action history and the degree of first narrowing down. A keyword generation unit that identifies and generates candidate keywords that are candidates for comments for each of the identified images of a plurality of objects; A specifying unit that specifies one or more target keywords from a plurality of candidate keywords generated by the keyword generating unit, and a comment generating unit that generates comments related to the target keywords for each of the one or more target keywords. and an adjustment unit that adjusts the degree of first narrowing down and the degree of second narrowing down according to processing information related to the processing of the keyword generating unit and the specifying unit.

また、以上の課題を解決するために、本発明の好適な態様に係る情報処理システムは、ユーザが管理するユーザ装置と、サーバ装置とを備える情報処理システムであって、前記ユーザ装置は、前記ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部と、前記行動情報、前記キーワード生成部によって生成された複数の候補キーワード、及び前記キーワード生成部の処理に関する処理情報を前記サーバ装置へ送信し、前記サーバ装置から送信されるコメントを受信する第1通信装置と、前記コメントを表示装置に表示させる表示制御部と、を備え、前記サーバ装置は、前記ユーザ装置から送信される前記行動情報、前記複数の候補キーワード及び前記キーワード生成部の処理に関する処理情報を受信し、前記コメントを前記ユーザ装置へ送信する第2通信装置と、前記行動情報と第2の絞り込みの程度とに基づいて、コメントの対象となる一又は複数の対象キーワードを前記複数の候補キーワードから特定する特定部と、前記一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを前記コメントとして生成するコメント生成部と、前記第1の絞り込みの程度と前記第2の絞り込みの程度とを、前記キーワード生成部の処理に関する処理情報及び前記特定部の処理に関する処理情報に応じて調整する調整部とを備える。 Further, in order to solve the above problems, an information processing system according to a preferred aspect of the present invention is an information processing system comprising a user device managed by a user and a server device, wherein the user device comprises the A plurality of images of objects are identified from the moving image based on the action information indicating the user's action history and the degree of the first narrowing down, and candidate keywords that are candidates for comments are determined for each of the plurality of identified images. A comment transmitted from the server device by transmitting a keyword generation unit to be generated, the action information, a plurality of candidate keywords generated by the keyword generation unit, and processing information related to the processing of the keyword generation unit to the server device. and a display control unit for displaying the comment on a display device, wherein the server device receives the action information, the plurality of candidate keywords and the keyword generation transmitted from the user device a second communication device that receives processing information about processing of a part and transmits the comment to the user device; a specifying unit that specifies a keyword from the plurality of candidate keywords; a comment generating unit that generates, as the comment, a comment related to the target keyword for each of the one or more target keywords; and the degree of the first narrowing down. and the degree of the second narrowing down according to processing information about the processing of the keyword generating unit and processing information about the processing of the specifying unit.

本発明に係る情報処理装置又は情報処理システムによれば、複数の物体の画像を特定する絞り込みの処理負荷と複数の候補キーワードから対象キーワードを特定する絞り込みの処理負荷とを処理能力に応じて調整することができる。 According to the information processing apparatus or information processing system according to the present invention, the processing load of narrowing down to identify a plurality of object images and the processing load of narrowing down to identify a target keyword from a plurality of candidate keywords are adjusted according to the processing power. can do.

本発明の第1実施形態に係るサービスシステムの全体構成を示すブロック図である。It is a block diagram showing the whole service system composition concerning a 1st embodiment of the present invention. 同実施形態に用いるサーバ装置のハードウェア構成を例示するブロック図である。It is a block diagram which illustrates the hardware constitutions of the server apparatus used for the same embodiment. 同実施形態に用いるサーバ装置の機能を示す機能ブロック図である。3 is a functional block diagram showing functions of a server device used in the same embodiment; FIG. 同実施形態における物体の画像の一例を示す説明図である。It is an explanatory view showing an example of an image of an object in the same embodiment. 同実施形態に用いるサーバ装置の動作を示すフローチャートである。It is a flowchart which shows operation|movement of the server apparatus used for the same embodiment. 第2実施形態に用いるユーザ装置のハードウェア構成を例示するブロック図である。FIG. 11 is a block diagram illustrating the hardware configuration of a user device used in the second embodiment; FIG. 第2実施形態に用いるユーザ装置の機能を示す機能ブロック図である。FIG. 8 is a functional block diagram showing functions of a user device used in the second embodiment; 同実施形態に用いるユーザ装置の動作を示すフローチャートである。It is a flowchart which shows operation|movement of the user apparatus used for the same embodiment. 第3実施形態に用いるサーバ装置のハードウェア構成を例示するブロック図である。FIG. 12 is a block diagram illustrating the hardware configuration of a server device used in the third embodiment; FIG. 同実施形態に用いるサーバ装置の機能を示す機能ブロック図である。3 is a functional block diagram showing functions of a server device used in the same embodiment; FIG. 同実施形態に用いるユーザ装置のハードウェア構成を例示するブロック図である。It is a block diagram which illustrates the hardware constitutions of the user's apparatus used for the same embodiment. 同実施形態に用いるユーザ装置の機能を示す機能ブロック図である。3 is a functional block diagram showing functions of a user device used in the same embodiment; FIG. 同実施形態に用いるサーバ装置及びユーザ装置の各々の動作を示すフローチャートである。It is a flowchart which shows each operation|movement of a server apparatus and a user apparatus which are used for the same embodiment.

[1.第1実施形態]
[1.1.サービスシステムの構成]
図1は、本発明の第1実施形態に係るサービスシステムの全体構成を示すブロック図である。図1に示されるサービスシステム1は、動画の配信サービスを提供する。例えば、動画の配信サービスは、映画又は地上波デジタル放送のコンテンツ等を提供する。
[1. First Embodiment]
[1.1. Service system configuration]
FIG. 1 is a block diagram showing the overall configuration of a service system according to the first embodiment of the invention. A service system 1 shown in FIG. 1 provides a video distribution service. For example, a moving image distribution service provides content of movies or terrestrial digital broadcasting.

図1に例示するように、サービスシステム1は、ユーザU_1~ユーザU_mが管理するユーザ装置20_1~20_m(mは1以上の整数)と、ネットワークNWと、サーバ装置10とを備える。ネットワークNWは移動体通信網又はインターネット等を含む電気通信回線である。以下の説明では、同種の要素を区別しない場合には、ユーザ装置20、ユーザUのように、参照符号のうちの共通番号だけを使用する。 As illustrated in FIG. 1, the service system 1 includes user devices 20_1 to 20_m (m is an integer equal to or greater than 1) managed by users U_1 to U_m, a network NW, and a server device . The network NW is a telecommunications line including a mobile communication network or the Internet. In the following description, only common numbers among reference numerals are used, such as user device 20 and user U, when similar elements are not distinguished.

ユーザ装置20は、各種の情報を処理する情報処理装置である。ユーザ装置20は、例えば、スマートフォン又はタブレット端末等の可搬型の情報処理装置である。但し、ユーザ装置20としては、任意の情報処理装置を採用することができる。ユーザ装置20は、例えば、パーソナルコンピュータ等の端末型の情報処理装置であってもよい。 The user device 20 is an information processing device that processes various types of information. The user device 20 is, for example, a portable information processing device such as a smart phone or a tablet terminal. However, any information processing device can be adopted as the user device 20 . The user device 20 may be, for example, a terminal-type information processing device such as a personal computer.

ユーザ装置20は、ネットワークNWを介して、サーバ装置10と通信可能である。ユーザ装置20は、サーバ装置10から送信される画像信号Saを受信して当該画像信号Saに応じた画像を表示したり、或いは画像信号Saをテレビジョン受像機30に送信してテレビジョン受像機30に画像を表示させることができる。また、ユーザ装置20は、ネットワークNWを介して、行動情報をサーバ装置10に送信する。行動情報は、ユーザの行動履歴を示す。行動情報は、ユーザの位置を示す位置情報、ユーザの物品又はサービスの購買に関する購買情報、webの閲覧に関する閲覧情報、及び動画又は音楽の再生に関する再生情報の各々に、時間情報を対応付けた情報である。 The user device 20 can communicate with the server device 10 via the network NW. The user device 20 receives the image signal Sa transmitted from the server device 10 and displays an image corresponding to the image signal Sa, or transmits the image signal Sa to the television receiver 30 and 30 can be caused to display an image. Also, the user device 20 transmits behavior information to the server device 10 via the network NW. The action information indicates the user's action history. The behavior information is information in which time information is associated with each of position information indicating the user's position, purchase information regarding the user's purchase of goods or services, browsing information regarding web browsing, and playback information regarding video or music playback. is.

サーバ装置10は、動画を示す画像信号Saをユーザ装置20へ送信する動画配信機能と、コメント生成機能とを有する情報処理装置である。コメント生成機能とは、画像信号Saの示す動画の一画面の画像に含まれる複数の物体の画像からユーザUの関心のある物体の画像を当該ユーザの行動履歴に基づいて絞り込み、絞り込んだ物体の画像についてのコメントを生成する機能である。 The server device 10 is an information processing device having a moving image distribution function of transmitting an image signal Sa representing a moving image to the user device 20 and a comment generating function. The comment generating function narrows down images of objects of interest to the user U based on the action history of the user from among a plurality of images of objects included in one screen image of the moving image indicated by the image signal Sa, and selects the images of the narrowed down objects. It is a function to generate comments about images.

[1.2.サーバ装置10の構成]
図2は、サーバ装置10のハードウェア構成を例示するブロック図である。サーバ装置10は、処理装置11A、記憶装置12A、通信装置14A、及びバス19を具備するコンピュータシステムにより実現される。処理装置11A、記憶装置12A、及び通信装置14Aは、情報を通信するためのバス19で接続される。バス19は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。なお、サーバ装置10の各要素は、単数又は複数の機器で構成され、サーバ装置10の一部の要素は省略されてもよい。
[1.2. Configuration of server device 10]
FIG. 2 is a block diagram illustrating the hardware configuration of the server device 10. As shown in FIG. The server device 10 is implemented by a computer system comprising a processing device 11A, a storage device 12A, a communication device 14A, and a bus 19. FIG. The processing device 11A, storage device 12A, and communication device 14A are connected by a bus 19 for communicating information. The bus 19 may be composed of a single bus, or may be composed of different buses between devices. Note that each element of the server device 10 may be composed of one or more devices, and some elements of the server device 10 may be omitted.

処理装置11Aは、サーバ装置10の全体を制御するプロセッサであり、例えば単数又は複数のチップで構成される。処理装置11Aは、例えば、周辺装置とのインタフェース、演算装置及びレジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成される。なお、処理装置11Aの機能の一部又は全部は、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアで実現されてもよい。処理装置11Aは、各種の処理を並列的又は逐次的に実行する。 The processing device 11A is a processor that controls the entire server device 10, and is composed of, for example, one or more chips. The processing device 11A is composed of, for example, a central processing unit (CPU) including an interface with peripheral devices, an arithmetic device, registers, and the like. Some or all of the functions of the processing device 11A are realized by hardware such as a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array). may The processing device 11A executes various processes in parallel or sequentially.

記憶装置12Aは、処理装置11Aが読取可能な記録媒体である。記憶装置12Aは、処理装置11Aが実行する制御プログラムPRaを含む複数のプログラム、特徴量テーブルTBLa、コメントテーブルTBLb、サービスデータDS、及び処理装置11Aが使用する各種のデータを記憶する。記憶装置12Aは、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)等の記憶回路の1種類以上で構成される。 The storage device 12A is a recording medium readable by the processing device 11A. The storage device 12A stores a plurality of programs including a control program PRa executed by the processing device 11A, a feature amount table TBLa, a comment table TBLb, service data DS, and various data used by the processing device 11A. The storage device 12A is composed of, for example, one or more types of storage circuits such as ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), and RAM (Random Access Memory).

特徴量テーブルTBLaは、物体の種類を示す単語と特徴量とを対応付けて記憶する。物体の種類を示す単語は、例えば、マルチーズ(Maltese dogs)、ワイン等の名詞である。特徴量は物体の形状に関する第1の特徴量及び物体の色に関する第2の特徴量を含む。例えば、マルチーズという単語に対応付けて特徴量テーブルTBLaに記憶されている特徴量は、マルチーズの形状に関する第1の特徴量とマルチーズの色に関する第2の特徴量を含む。また、液体のように特定の形状を有さない物体については、特徴量テーブルTBLaには当該物体の種類を示す単語に対応付けて、当該物体を収納する容器の形状に関する第1の特徴量と当該物体の色に関する第2の特徴量が記憶されている。例えば、ワインという単語に対応付けて特徴量テーブルTBLaに記憶されている特徴量は、ワインボトルの形状に関する第1の特徴量とワインの色に関する第2の特徴量を含む。 The feature amount table TBLa associates and stores words indicating types of objects and feature amounts. Words indicating types of objects are, for example, nouns such as Maltese dogs and wine. The feature amount includes a first feature amount regarding the shape of the object and a second feature amount regarding the color of the object. For example, the feature quantity stored in the feature quantity table TBLa in association with the word maltese includes a first feature quantity relating to the shape of the maltese and a second feature quantity relating to the color of the maltese. For an object that does not have a specific shape, such as a liquid, the feature quantity table TBLa associates a word indicating the type of the object with a first feature value related to the shape of the container that stores the object. A second feature quantity relating to the color of the object is stored. For example, the feature quantity stored in the feature quantity table TBLa in association with the word wine includes a first feature quantity relating to the shape of the wine bottle and a second feature quantity relating to the color of the wine.

サービスデータDSは、ネットワークNWを介してサーバ装置10からユーザ装置20にストリーミングにより配信される動画を表す動画データである。サービスデータDSは、圧縮されており、Iフレーム(I-frame: Intra-coded frame)、Pフレーム(P-frame: Predicted Frame)、及びBフレーム(B-frame: Bi-directional Predicted Frame)を有する。Iフレームは非圧縮のフレームである。Pフレーム及びBフレームの各々は差分のフレームである。処理装置11Aは、サービスデータDSを伸長して画像信号Saを生成する。 The service data DS is moving image data representing a moving image distributed by streaming from the server device 10 to the user device 20 via the network NW. The service data DS is compressed and has an I frame (I-frame: Intra-coded frame), a P frame (P-frame: Predicted Frame), and a B frame (B-frame: Bi-directional Predicted Frame). . An I-frame is an uncompressed frame. Each of the P-frames and B-frames is a differential frame. The processing device 11A expands the service data DS to generate the image signal Sa.

通信装置14Aの一例としては、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード又は通信モジュールが挙げられる。通信装置14Aは、処理装置11Aによる制御の下、ネットワークNWを介してユーザ装置20と通信する。通信装置14Aは、画像信号Saをユーザ装置20へ送信する。また、通信装置14Aは、ユーザ装置20から送信される行動情報を受信し、コメント生成機能により生成したコメントをユーザ装置20へ送信する。 Examples of the communication device 14A include, for example, network devices, network controllers, network cards, or communication modules. The communication device 14A communicates with the user device 20 via the network NW under the control of the processing device 11A. The communication device 14A transmits the image signal Sa to the user device 20. FIG. The communication device 14A also receives action information transmitted from the user device 20 and transmits comments generated by the comment generation function to the user device 20 .

[1.3.サーバ装置10の機能]
図3は、サーバ装置10の機能を示す機能ブロック図である。処理装置11Aは記憶装置12Aから制御プログラムPRaを読み取り実行することによって、キーワード生成部110A、特定部120、コメント生成部130、及び調整部140として機能する。
[1.3. Function of server device 10]
FIG. 3 is a functional block diagram showing functions of the server device 10. As shown in FIG. The processing device 11A functions as a keyword generation unit 110A, a specification unit 120, a comment generation unit 130, and an adjustment unit 140 by reading and executing the control program PRa from the storage device 12A.

キーワード生成部110Aは、ネットワークNWを介してユーザ装置20から受信した行動情報と第1の絞り込みの程度とに基づいて、ユーザの関心のある複数の物体の画像を動画から特定する。 Keyword generation unit 110A identifies images of a plurality of objects of interest to the user from the moving image based on the behavior information received from user device 20 via network NW and the degree of first narrowing down.

キーワード生成部110Aには、調整部140から第1制御情報SDaが与えられる。第1制御情報SDaは、第1の絞り込みの程度を示す情報の一例である。第1制御情報SDaは、キーワード生成部110Aにおける絞り込みの程度を指定する。第1制御情報SDaは、例えばレベル1~3を指定する。レベル1は絞り込みの程度「低」を意味する。レベル2は絞り込みの程度「中」を意味する。レベル3は絞り込みの程度「高」を意味する。絞り込みの程度が「低」とは、行動情報の示す行動履歴を広く浅く解析して絞り込みを行うことを意味する。絞り込みの程度が「高」とは、行動情報の示す行動履歴を深く解析して絞り込みを行うことを意味する。第1制御情報SDaによりレベル1が指定された場合、絞り込みの程度が低いので、キーワード生成部110Aにより生成される候補キーワードKWの数は多くなる。一方、第1制御情報SDaによりレベル3が指定された場合、絞り込みの程度が高いので、キーワード生成部110Aにより絞り込まれる候補キーワードKWの数は少なくなる。絞り込みの程度が高いほど行動履歴を深く解析するので、キーワード生成部110Aの処理負荷は高くなる。 The first control information SDa is provided from the adjuster 140 to the keyword generator 110A. The first control information SDa is an example of information indicating the degree of first narrowing down. The first control information SDa designates the degree of narrowing down in the keyword generator 110A. The first control information SDa designates levels 1 to 3, for example. Level 1 means "low" degree of refinement. Level 2 means "medium" degree of refinement. Level 3 means "high" degree of narrowing down. A "low" degree of narrowing down means that narrowing down is performed by broadly and shallowly analyzing the action history indicated by the action information. A "high" degree of narrowing down means that the action history indicated by the action information is deeply analyzed and narrowed down. When level 1 is specified by the first control information SDa, the degree of narrowing down is low, so the number of candidate keywords KW generated by the keyword generation unit 110A increases. On the other hand, when level 3 is specified by the first control information SDa, the degree of narrowing down is high, so the number of candidate keywords KW narrowed down by the keyword generation unit 110A is small. The higher the degree of narrowing down, the deeper the analysis of the action history, so the processing load on the keyword generation unit 110A increases.

図3に示すように、キーワード生成部110Aは、決定部111、特徴量生成部112、抽出部113A、及び変換部114を備える。 As shown in FIG. 3, the keyword generation unit 110A includes a determination unit 111, a feature amount generation unit 112, an extraction unit 113A, and a conversion unit 114.

決定部111は、物体に対するユーザの関心の程度を評価した結果と第1制御情報SDaとに基づいて、動画から抽出する物体の種類を決定する。物体に対するユーザの関心の程度の評価には評価関数が用いられる。評価関数は、所定期間(例えば、過去1ヶ月)の行動情報の示す時間情報、位置情報、購買情報、閲覧情報、及び再生情報を変数とし、ユーザの関心がある物体についての関心の程度を評価値として出力する。第1制御情報SDaの示す絞り込みの程度が低いほど多くの物体の種類が決定される。
具体的には、決定部111は、絞り込みの程度に応じた閾値と評価値とを比較することによって、動画から抽出する物体の種類を決定する。例えば、再生情報がサッカーの試合の動画が再生されたことを示すものとする。また、再生されたサッカーの試合は、サッカーチームAとサッカーチームBとの対戦であったものとする。また、購買情報がサッカーチームAに属する特定のサッカー選手のユニフォームの購入を示すものとする。さらに、「サッカー」に関する物体についての評価値をX1、「サッカーチームA」に関する物体についての評価値をX2、特定のサッカー選手に関する物体についての評価値をX3とする。この場合、「サッカー」の概念が最も広く、「特定のサッカー選手」の概念が最も狭い。そして、「サッカーチームA」の概念は、「サッカー」の概念と「特定のサッカー選手」の概念の中間にある。すなわち、ユーザの関心は、「特定のサッカー選手」、「サッカーチームA」、「サッカー」の順に高いと言える。評価値は、X3>X2>X1となる。
ここで、絞り込みの程度がレベル1に対応する閾値がR1であるとする。絞り込みの程度がレベル2に対応する閾値がR2であるとする。絞り込みの程度がレベル3に対応する閾値がR3であるとする。さらに、X3>R3>X2>R2>X1>R1であるとする。
絞り込みの程度がレベル1の場合、決定部111は動画から抽出する物体の種類として「サッカーに関する物体」を決定する。絞り込みの程度がレベル2の場合、決定部111は動画から抽出する物体の種類として「サッカーチームAに関する物体」を決定する。絞り込みの程度がレベル3の場合、決定部111は動画から抽出する物体の種類として「特定のサッカー選手に関する物体」を決定する。決定部111は、絞り込みの程度に応じた閾値と評価値とを比較することによって、動画から抽出する物体の種類を決定する。
The determination unit 111 determines the type of object to be extracted from the moving image based on the result of evaluating the user's degree of interest in the object and the first control information SDa. An evaluation function is used to evaluate the user's degree of interest in the object. The evaluation function uses time information, position information, purchase information, browsing information, and playback information indicating behavior information for a predetermined period (for example, the past month) as variables, and evaluates the degree of interest of the user in the object of interest. Output as a value. More types of objects are determined as the degree of narrowing indicated by the first control information SDa is lower.
Specifically, the determination unit 111 determines the type of object to be extracted from the moving image by comparing the threshold corresponding to the degree of narrowing down and the evaluation value. For example, the playback information may indicate that a video of a soccer game was played. It is also assumed that the reproduced soccer match was a match between soccer team A and soccer team B. Also assume that the purchase information indicates the purchase of a uniform for a particular soccer player belonging to soccer team A. Further, let the evaluation value for the object related to "soccer" be X1, the evaluation value for the object related to "soccer team A" be X2, and the evaluation value for the object related to a specific soccer player be X3. In this case, the concept of "soccer" is the broadest and the concept of "a particular soccer player" is the narrowest. And the concept of "soccer team A" is intermediate between the concept of "soccer" and the concept of "a particular soccer player". That is, it can be said that the user's interest is higher in the order of "specific soccer player", "soccer team A", and "soccer". The evaluation values are X3>X2>X1.
Here, it is assumed that the threshold corresponding to level 1 of the degree of narrowing down is R1. Assume that the threshold corresponding to level 2 of the degree of narrowing down is R2. Assume that the threshold corresponding to level 3 of the degree of narrowing down is R3. Furthermore, assume that X3>R3>X2>R2>X1>R1.
When the degree of narrowing down is level 1, the determining unit 111 determines “objects related to soccer” as the type of object to be extracted from the moving image. When the degree of narrowing down is level 2, the determining unit 111 determines “objects related to soccer team A” as the type of object to be extracted from the moving image. When the degree of narrowing down is level 3, the determining unit 111 determines “objects related to a specific soccer player” as the type of object to be extracted from the moving image. The determining unit 111 determines the type of object to be extracted from the moving image by comparing the threshold corresponding to the degree of narrowing down and the evaluation value.

特徴量生成部112は、決定部111により決定された物体の種類について、当該種類の物体の特徴量を生成する。特徴量生成部112は、決定部111により決定された物体の種類に対応する特徴量を特徴量テーブルTBLaから読み出すことで、物体の特徴量を生成する。 For the type of object determined by the determination unit 111, the feature amount generation unit 112 generates a feature amount of the object of the type. The feature quantity generation unit 112 reads the feature quantity corresponding to the type of the object determined by the determination unit 111 from the feature quantity table TBLa to generate the feature quantity of the object.

抽出部113Aは、特徴量生成部112により生成された特徴量を有する物体の画像をサービスデータDSから抽出する。抽出部113Aは、サービスデータDSに含まれるIフレーム、Pフレーム及びBフレームのうち、Iフレームの画像から物体の画像を抽出する。1つのIフレームの画像には、多数の物体の画像が存在する。Iフレームの画像が、図4に示されるものである場合、抽出部113Aは、例えば画像OB1~OB5を抽出する。 113 A of extraction parts extract the image of the object which has the feature-value produced|generated by the feature-value production|generation part 112 from the service data DS. The extraction unit 113A extracts the image of the object from the I-frame image among the I-frame, P-frame, and B-frame included in the service data DS. There are many object images in one I-frame image. When the I-frame images are those shown in FIG. 4, the extraction unit 113A extracts images OB1 to OB5, for example.

変換部114は、抽出部113Aによって抽出された複数の物体の画像OBの各々についてコメントの対象の候補となる候補キーワードKWを生成する。具体的には、変換部114は、複数の物体の画像OBの各々を候補キーワードKWに変換する。変換部114は、例えば、機械学習により学習された画像認識モデルを用いて、物体の画像OBを候補キーワードKWに変換する。例えば、図4に示される画像OB1は「ワイン」に、画像OB2は「ワイングラス」に、画像OB3は「時計」に、画像OB4は「キャンドル」に、画像OB5は「洋食」に夫々変換される。 The conversion unit 114 generates a candidate keyword KW as a comment target candidate for each of the plurality of object images OB extracted by the extraction unit 113A. Specifically, the conversion unit 114 converts each of the plurality of object images OB into candidate keywords KW. The conversion unit 114 converts the image OB of the object into the candidate keyword KW using, for example, an image recognition model learned by machine learning. For example, image OB1 shown in FIG. 4 is converted to "wine", image OB2 to "wine glass", image OB3 to "clock", image OB4 to "candle", and image OB5 to "Western food". be.

特定部120は、行動情報を用いた絞り込みにより、キーワード生成部110Aよって生成された複数の候補キーワードKWからコメントの対象となる一又は複数の対象キーワードKXを特定する。前述したように、行動情報には、時間情報、位置情報、購買情報、閲覧情報、及び再生情報が含まれる。特定部120は、複数の候補キーワードKWの各々について、時間情報、位置情報、購買情報、閲覧情報、及び再生情報を変数として評価関数により評価値を算出する。特定部120は、複数の候補キーワードKWを評価値の高い順にランク付けする。次いで、特定部120は、コメントの対象となる一又は複数の対象キーワードKXを、複数の候補キーワードKWの各々のランクと第2制御情報SDbとに基づいて特定する。第2制御情報SDbは、第2の絞り込みの程度を示す情報の一例である。 The identifying unit 120 identifies one or more target keywords KX to be commented from among the plurality of candidate keywords KW generated by the keyword generating unit 110A by narrowing down using the behavior information. As described above, the action information includes time information, location information, purchase information, browsing information, and playback information. The specifying unit 120 calculates an evaluation value for each of the plurality of candidate keywords KW using an evaluation function using time information, position information, purchase information, browsing information, and reproduction information as variables. The identifying unit 120 ranks the plurality of candidate keywords KW in descending order of evaluation value. Next, the specifying unit 120 specifies one or a plurality of target keywords KX to be commented on based on the rank of each of the plurality of candidate keywords KW and the second control information SDb. The second control information SDb is an example of information indicating the degree of second narrowing down.

第2制御情報SDbは調整部140により生成され、調整部140から特定部120に与えられる。第2制御情報SDbは、第1制御情報SDaと同様に、例えばレベル1~3を指定する。レベル1、レベル2及びレベル3の意味は、前述した第1制御情報SDaにおけるレベル1、レベル2及びレベル3の各々の意味と同じである。 The second control information SDb is generated by the adjusting section 140 and provided from the adjusting section 140 to the specifying section 120 . The second control information SDb designates levels 1 to 3, for example, like the first control information SDa. The meanings of level 1, level 2 and level 3 are the same as those of level 1, level 2 and level 3 in the first control information SDa described above.

特定部120は、第2制御情報SDbの示す絞り込みの程度が低いほど、多くの対象キーワードKXを特定する。第2制御情報SDbによりレベル1が指定された場合、絞り込みの程度が低いので、特定部120における絞り込みにより得られる対象キーワードKXの数は多くなる。一方、第2制御情報SDbによりレベル3が指定された場合、絞り込みの程度が高いので、特定部120における絞り込みにより得られる対象キーワードKXの数は少なくなる。絞り込みの程度が高いほど、特定部120の処理負荷は高くなる。 The identification unit 120 identifies more target keywords KX as the degree of narrowing indicated by the second control information SDb is lower. When level 1 is specified by the second control information SDb, the degree of narrowing down is low, so the number of target keywords KX obtained by narrowing down in the specifying unit 120 increases. On the other hand, when level 3 is specified by the second control information SDb, the degree of narrowing down is high, so the number of target keywords KX obtained by narrowing down in the specifying unit 120 is small. As the degree of narrowing down increases, the processing load on the identification unit 120 increases.

コメント生成部130は、一又は複数の対象キーワードKXの各々について、関連するコメントを生成する。コメントとは、対象キーワードKXについての説明又は解説の意味である。また、コメントはレコメンドを含む概念である。このため、対象キーワードKXに関連してユーザUに購入を勧める商品及び商品を取り扱う店舗に関する情報がコメントに含まれる。コメント生成部130は、キーワードに対応付けてコメントを記憶したコメントテーブルTBLbから対象キーワードKXに対応するコメントを読み出すことによって、コメントを生成する。あるいは、コメント生成部130は、ネットワークNWに接続される検索サイトにアクセスして対象キーワードKXに関連する情報を取得し、取得した情報をコメントとして用いてもよい。コメント生成部130により生成されたコメントは、例えば電子メール等で通信装置14Aによってユーザ装置20へ送信される。 The comment generating unit 130 generates related comments for each of one or more target keywords KX. A comment means an explanation or commentary on the target keyword KX. A comment is a concept including recommendations. For this reason, the comment includes information about the product that the user U is recommended to purchase and the store that sells the product in relation to the target keyword KX. The comment generation unit 130 generates a comment by reading a comment corresponding to the target keyword KX from the comment table TBLb storing comments in association with keywords. Alternatively, the comment generation unit 130 may access a search site connected to the network NW, acquire information related to the target keyword KX, and use the acquired information as a comment. The comment generated by the comment generator 130 is transmitted to the user device 20 by the communication device 14A, for example, by e-mail.

調整部140は、キーワード生成部110Aにおいて物体の種類を絞り込む程度(第1の絞り込みの程度)と、特定部120において複数の候補キーワードKWから一又は複数の対象キーワードKXを絞り込む程度(第2の絞り込みの程度)とを、キーワード生成部110Aの処理及び特定部120の処理に関する処理情報に応じて調整する。処理情報は、キーワード生成部110Aの処理能力及び特定部120の処理能力を示す情報である。キーワード生成部110Aの処理能力及び特定部120の処理能力は、CPUの処理能力、或いはキーワード生成部110Aの機能と特定部120の機能とに夫々割り当てられるCPUのリソースに応じて変化する。 The adjustment unit 140 adjusts the degree to which the keyword generation unit 110A narrows down the types of objects (first degree of narrowing down) and the degree to which the specifying unit 120 narrows down one or more target keywords KX from a plurality of candidate keywords KW (second degree of narrowing down). degree of narrowing down) is adjusted according to processing information relating to the processing of the keyword generation unit 110A and the processing of the identification unit 120. FIG. The processing information is information indicating the processing capability of the keyword generation unit 110A and the processing capability of the identification unit 120. FIG. The processing capacity of the keyword generating section 110A and the processing capacity of the specifying section 120 change according to the processing capacity of the CPU or the resources of the CPU allocated to the functions of the keyword generating section 110A and the specifying section 120, respectively.

調整部140は、CPUの処理能力が予め定められた閾値を上回っている場合、又は特定部120の機能に割り当てられるリソースがキーワード生成部110Aの機能に割り当てられるリソースよりも多い場合には、特定部120の処理能力が高いと判定する。リソースの大小は、例えば、コア数及びスレッド数の少なくとも一方の大小によって定まる。例えば、キーワード生成部110Aに割り当てられるコア数が「1」且つスレッド数が「1」であり、特定部120に割り当てられるコア数が「1」且つスレッド数が「2」であることを想定する。この場合、特定部120の処理能力は、キーワード生成部110Aの処理能力よりも高いと判定する。
特定部120の処理能力が高いと判定した場合、調整部140は、キーワード生成部110Aにおける絞り込みの程度を低くし、特定部120における絞り込みの程度を高くする。具体的には、調整部140は、レベル1を示す第1制御情報SDaと、レベル3を示す第2制御情報SDbとを生成する。レベル1を示す第1制御情報SDaが与えられることで、キーワード生成部110Aの処理負荷は低くなる。一方、レベル3を示す第2制御情報SDbが与えられることで、特定部120の処理負荷は高くなる。
If the processing power of the CPU exceeds a predetermined threshold value, or if the resources allocated to the function of the identification unit 120 are greater than the resources allocated to the function of the keyword generation unit 110A, the adjustment unit 140 performs the identification It is determined that the processing capability of the unit 120 is high. The size of resources is determined, for example, by at least one of the number of cores and the number of threads. For example, assume that the number of cores and the number of threads allocated to the keyword generation unit 110A is "1" and the number of threads is "1", and the number of cores and the number of threads allocated to the identification unit 120 is "1" and "2". . In this case, it is determined that the processing capability of the identification unit 120 is higher than the processing capability of the keyword generation unit 110A.
When determining that the processing capability of the identifying unit 120 is high, the adjusting unit 140 decreases the degree of narrowing down in the keyword generating unit 110A and increases the degree of narrowing down in the identifying unit 120 . Specifically, adjustment section 140 generates first control information SDa indicating level 1 and second control information SDb indicating level 3. FIG. By providing the first control information SDa indicating level 1, the processing load of the keyword generation unit 110A is reduced. On the other hand, when the second control information SDb indicating level 3 is given, the processing load on the identifying unit 120 increases.

特定部120の処理能力が低いと判定した場合には、調整部140は、キーワード生成部110Aにおける絞り込みの程度を高くし、特定部120における絞り込みの程度を低くする。具体的には、調整部140は、レベル3を示す第1制御情報SDaと、レベル1を示す第2制御情報SDbとを生成する。レベル3を示す第1制御情報SDaを与えられることで、キーワード生成部110Aの処理負荷は高くなる。一方、レベル3を示す第2制御情報SDbを与えられることで、特定部120の処理負荷は低くなる。 When determining that the processing capability of the identifying unit 120 is low, the adjusting unit 140 increases the degree of narrowing down in the keyword generating unit 110A and decreases the degree of narrowing down in the identifying unit 120 . Specifically, adjustment section 140 generates first control information SDa indicating level 3 and second control information SDb indicating level 1 . Given the first control information SDa indicating level 3, the processing load on the keyword generation unit 110A increases. On the other hand, given the second control information SDb indicating level 3, the processing load on the identification unit 120 is reduced.

特定部120の処理能力が高い場合にキーワード生成部110Aにおける絞り込みの程度を低くし、特定部120における絞り込みの程度を高くする理由は次の通りである。キーワード生成部110Aは、ユーザUの関心のある物体を、抽出部113Aにおいて画像を解析することによって抽出する。しかし、画像処理を用いた物体の抽出の精度は低い。従って、特定部120の処理能力が高い場合には、キーワード生成部110Aにおける絞り込みの程度を低くする。絞り込みの程度を低くすることによって、絞り込みの程度が高い場合と比較して、キーワード生成部110Aで生成される候補キーワードKWの数は増加する。しかし、特定部120の処理能力が高いので、特定部120は、増加した候補キーワードKWの中から、対象キーワードKXを絞り込むことができる。
一方、特定部120の処理能力が低い場合、処理能力を上回る数の候補キーワードKWが生成されると、特定部120の処理に遅延が発生する。この結果、適切なタイミングでコメントを生成することが困難になる。このような場合には、候補キーワードKWの精度を犠牲にしてキーワード生成部110Aが生成する候補キーワードKWの数を減少させることが望ましい。
調整部140は、キーワード生成部110Aの処理能力及び特定部120の処理能力に応じて、キーワード生成部110Aにおいて物体の種類を絞り込む程度と、特定部120において複数の候補キーワードKWから一又は複数の対象キーワードKXを絞り込む程度とを、調整する。この結果、特定部120コメントの的確性が向上する。また、処理の遅延が抑制されることによって、適切なタイミングでコメントが生成される。
さらに、キーワード生成部110Aの処理能力と、特定部120の処理能力とは、動的に変更されることがある。処理能力が動的に変更される例としては、処理装置11Aの処理負荷の増加に伴い、キーワード生成部110Aに割り当てられるリソースと特定部120に割り当てられるリソースが減少する場合である。このような場合、調整部140は、キーワード生成部110Aの処理能力及び特定部120の処理能力に応じて、キーワード生成部110Aの絞り込みの程度と、特定部120の絞り込みの程度とを、調整する。そのため、コメントの的確性が向上する。コメントが適切なタイミングで生成される。
The reason for lowering the degree of narrowing down in the keyword generation unit 110A and increasing the degree of narrowing down in the specifying unit 120 when the processing capability of the specifying unit 120 is high is as follows. 110 A of keyword production|generation parts extract the object which the user U is interested in by analyzing an image in 113 A of extraction parts. However, the accuracy of object extraction using image processing is low. Therefore, when the processing capability of the identification unit 120 is high, the degree of narrowing down in the keyword generation unit 110A is lowered. By lowering the degree of narrowing down, the number of candidate keywords KW generated by the keyword generation unit 110A increases compared to when the degree of narrowing down is high. However, since the identifying unit 120 has high processing capability, the identifying unit 120 can narrow down the target keyword KX from the increased candidate keywords KW.
On the other hand, if the processing capability of the identifying unit 120 is low, the processing of the identifying unit 120 will be delayed if the number of candidate keywords KW that exceeds the processing capability is generated. As a result, it becomes difficult to generate comments at appropriate times. In such a case, it is desirable to reduce the number of candidate keywords KW generated by the keyword generator 110A at the expense of the accuracy of the candidate keywords KW.
The adjustment unit 140 adjusts the extent to which the keyword generation unit 110A narrows down the types of objects in the keyword generation unit 110A and the identification unit 120 selects one or more from a plurality of candidate keywords KW according to the processing capabilities of the keyword generation unit 110A and the identification unit 120. The extent to which the target keyword KX is narrowed down is adjusted. As a result, the accuracy of the specific part 120 comment improves. In addition, comments are generated at appropriate timing by suppressing processing delays.
Furthermore, the processing capacity of the keyword generating section 110A and the processing capacity of the identifying section 120 may be dynamically changed. An example in which the processing capacity is dynamically changed is when the resources allocated to the keyword generation unit 110A and the resources allocated to the identification unit 120 decrease as the processing load of the processing device 11A increases. In such a case, the adjusting unit 140 adjusts the degree of narrowing down of the keyword generating unit 110A and the degree of narrowing down of the identifying unit 120 according to the processing ability of the keyword generating unit 110A and the processing ability of the identifying unit 120. . Therefore, the accuracy of comments is improved. Comments are generated in a timely manner.

[1.4.サーバ装置10の動作]
次に、サーバ装置10の動作について説明する。図5は、サーバ装置10の動作を示すフローチャートである。
[1.4. Operation of server device 10]
Next, operations of the server device 10 will be described. FIG. 5 is a flow chart showing the operation of the server device 10. As shown in FIG.

まず、処理装置11Aは、処理情報に応じて、第1制御情報SDaと第2制御情報SDbとを生成する(ステップS1)。サーバ装置10は、ユーザ装置20に比較して処理能力の高いCPUを有し、当該CPUの処理能力は所定の閾値を上回っている。ステップS1において処理装置11Aは、特定部120の能力が高いと判定し、レベル1を示す第1制御情報SDaと、レベル3を示す第2制御情報SDbと、を生成する。 First, the processing device 11A generates first control information SDa and second control information SDb according to processing information (step S1). The server device 10 has a CPU with higher processing power than the user device 20, and the processing power of the CPU exceeds a predetermined threshold. In step S1, the processing device 11A determines that the capability of the identifying unit 120 is high, and generates first control information SDa indicating level 1 and second control information SDb indicating level 3. FIG.

次に、処理装置11Aは、行動情報とステップS1にて生成した第1制御情報SDaに応じた絞り込みの程度とに基づいて、物体の種類を決定する。本動作例のステップS1において生成された第1制御情報SDaはレベル1を示すので、ステップS2における物体の絞り込みの程度は低くなる。 Next, the processing device 11A determines the type of object based on the action information and the degree of narrowing down according to the first control information SDa generated in step S1. Since the first control information SDa generated in step S1 of this operation example indicates level 1, the degree of object narrowing down in step S2 is low.

次に、処理装置11Aは、ステップS2にて決定した物体の種類に対応する特徴量を特徴量テーブルTBLaから読み出す(ステップS3)。 Next, the processing device 11A reads the feature quantity corresponding to the type of object determined in step S2 from the feature quantity table TBLa (step S3).

次に、処理装置11Aは、ステップS3にて読み出した特徴量に基づいて、サービスデータDSの示す動画のIフレームから物体の画像を抽出する(ステップS4A)。1フレームの画像には、複数のオブジェクト画像が存在するのが通常である。このため、処理装置11Aは、ステップS4Aの処理において複数の物体の画像を抽出する。 Next, the processing device 11A extracts the image of the object from the I frame of the moving image indicated by the service data DS based on the feature amount read out in step S3 (step S4A). A single frame image usually includes a plurality of object images. Therefore, the processing device 11A extracts images of a plurality of objects in the process of step S4A.

次に、処理装置11Aは、ステップS4Aにて抽出した複数の物体の画像の各々を候補キーワードKWに変換する(ステップS5)。 Next, the processing device 11A converts each of the plurality of object images extracted in step S4A into candidate keywords KW (step S5).

次に、処理装置11Aは、行動情報と第2制御情報SDbとに基づいて、ステップS5の処理により得られた複数の候補キーワードKWのうちから、対象キーワードKXを特定する(ステップS6)。本動作例のステップS1において生成された第2制御情報SDbはレベル3を示すので、ステップS6では行動情報を深く解析する絞り込みが行われる。 Next, the processing device 11A identifies the target keyword KX from among the plurality of candidate keywords KW obtained by the process of step S5 based on the action information and the second control information SDb (step S6). Since the second control information SDb generated in step S1 of this operation example indicates level 3, the action information is narrowed down to be deeply analyzed in step S6.

次に、処理装置11Aは、対象キーワードKXに関連するコメントを生成する(ステップS7)。ステップS7の処理において、処理装置11Aは対象キーワードKXに対応するコメントをコメントテーブルTBLbから読み出すことによってコメントを生成する。処理装置11Aは、生成したコメントを電子メール等でユーザ装置20へ送信する。 Next, the processing device 11A generates a comment related to the target keyword KX (step S7). In the processing of step S7, the processing device 11A generates a comment by reading the comment corresponding to the target keyword KX from the comment table TBLb. The processing device 11A transmits the generated comment to the user device 20 by e-mail or the like.

また、処理装置11Aは、ステップS1の処理において調整部140として機能し、ステップS2からステップS5の処理においてキーワード生成部110Aとして機能する。より詳細には、処理装置11Aは、ステップS2の処理において決定部111として機能し、ステップS3の処理において特徴量生成部112として機能し、ステップS4Aの処理において抽出部113Aとして機能し、ステップS5の処理において変換部114として機能する。さらに、処理装置11Aは、ステップS6の処理において特定部120として機能し、ステップS7の処理においてコメント生成部130として機能する。 Further, the processing device 11A functions as the adjustment unit 140 in the processing of step S1, and functions as the keyword generation unit 110A in the processing of steps S2 to S5. More specifically, the processing device 11A functions as the determination unit 111 in the process of step S2, functions as the feature amount generation unit 112 in the process of step S3, functions as the extraction unit 113A in the process of step S4A, and functions as the extraction unit 113A in the process of step S5. It functions as the conversion unit 114 in the processing of . Furthermore, the processing device 11A functions as the specifying unit 120 in the processing of step S6, and functions as the comment generating unit 130 in the processing of step S7.

本実施形態のサーバ装置10は、コメント生成機能を有する情報処理装置、すなわち本発明の情報処理装置、の一例である。サーバ装置10は、ユーザの行動履歴を示す行動情報に基づいて、複数の物体に各々対応する複数の画像を動画から絞り込み、絞りこまれた複数の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部110Aを備える。また、サーバ装置10は、行動情報に基づいて、キーワード生成部110Aによって生成された複数の候補キーワードを絞り込むことにより、コメントの対象となる一又は複数の対象キーワードを特定する特定部120を備える。さらに、サーバ装置10は、一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを生成するコメント生成部130と、キーワード生成部110Aにおいて複数の画像を絞り込む程度と、特定部120において複数の候補キーワードを絞り込む程度とを、キーワード生成部110A及び特定部120の処理に関する処理情報に応じて調整する調整部140と、を備える。 The server device 10 of this embodiment is an example of an information processing device having a comment generation function, that is, an information processing device of the present invention. The server device 10 narrows down a plurality of images each corresponding to a plurality of objects from the moving image based on action information indicating the user's action history, and candidates for commenting on each of the plurality of narrowed down images. A keyword generation unit 110A for generating keywords is provided. The server device 10 also includes a specifying unit 120 that specifies one or more target keywords to be commented on by narrowing down the plurality of candidate keywords generated by the keyword generating unit 110A based on the behavior information. Furthermore, for each of one or a plurality of target keywords, the server device 10 includes a comment generation unit 130 that generates a comment related to the target keyword, an extent to which a plurality of images are narrowed down in the keyword generation unit 110A, and and an adjustment unit 140 that adjusts the degree to which a plurality of candidate keywords are narrowed down according to processing information related to the processing of the keyword generation unit 110A and the identification unit 120 .

この態様によれば、特定部120の処理能力に応じてキーワード生成部110Aにおける絞り込みの程度と特定部120における絞り込みの程度とを調整することができる。上記実施形態のサーバ装置10では、特定部120の処理能力が高いため、キーワード生成部110Aにおける絞り込みの程度を低く、特定部120における絞り込みの程度を高く調整することで、コメントの的確性を向上させることができる。 According to this aspect, the degree of narrowing down in the keyword generation unit 110</b>A and the degree of narrowing down in the specifying unit 120 can be adjusted according to the processing capability of the specifying unit 120 . In the server device 10 of the above-described embodiment, since the processing capability of the identification unit 120 is high, the accuracy of comments is improved by adjusting the degree of narrowing down in the keyword generation unit 110A to be low and the degree of narrowing down in the identification unit 120 to be high. can be made

[2.第2実施形態]
第2実施形態のサービスシステム1では、サーバ装置10は動画配信機能のみを有し、ユーザ装置20がコメント生成機能を有する。
[2. Second Embodiment]
In the service system 1 of the second embodiment, the server device 10 has only the moving image distribution function, and the user device 20 has the comment generation function.

図6は、第2実施形態のユーザ装置20のハードウェア構成例を示す図である。ユーザ装置20は、処理装置11B、記憶装置12B、通信装置14B、表示制御部15、及びバス19を具備する。ユーザ装置20は、処理装置11B、記憶装置12B、通信装置14B、表示制御部15、及びバス19の他に、表示装置とスピーカとを含む出力装置、タッチパネル等の入力装置、近距離無線通信装置及びGPS装置を含んでもよい。近距離無線通信装置とは、近距離無線通信によって他の装置と通信する機器である。近距離無線通信には、例えばBluetooth(登録商標)、ZigBee(登録商標)、又は、WiFi(登録商標)等が挙げられる。GPS装置とは、複数の衛星からの電波を受信し、受信した電波から位置情報を生成する機器である。 FIG. 6 is a diagram showing a hardware configuration example of the user device 20 of the second embodiment. The user device 20 includes a processing device 11 B, a storage device 12 B, a communication device 14 B, a display control section 15 and a bus 19 . In addition to the processing device 11B, the storage device 12B, the communication device 14B, the display control unit 15, and the bus 19, the user device 20 includes an output device including a display device and a speaker, an input device such as a touch panel, and a short-range wireless communication device. and GPS devices. A short-range wireless communication device is a device that communicates with another device by short-range wireless communication. Short-range wireless communication includes, for example, Bluetooth (registered trademark), ZigBee (registered trademark), or WiFi (registered trademark). A GPS device is a device that receives radio waves from a plurality of satellites and generates position information from the received radio waves.

処理装置11B、記憶装置12B、及び通信装置14Bの各々は、第1実施形態における処理装置11A、記憶装置12A、及び通信装置14Aの各々に対応する。記憶装置12Bは、制御プログラムPRaに代えて制御プログラムPRbを記憶している点と、行動情報を記憶している点と、サービスデータDSを記憶していない点と、で記憶装置12Aと相違する。通信装置14Bは、処理装置11Bによる制御の下、サーバ装置10と通信する点で通信装置14Aと相違する。通信装置14Bは、サーバ装置10からネットワークNWを介して送信されてくる画像信号Saを受信する。 Each of the processing device 11B, the storage device 12B, and the communication device 14B corresponds to each of the processing device 11A, the storage device 12A, and the communication device 14A in the first embodiment. The storage device 12B differs from the storage device 12A in that it stores the control program PRb instead of the control program PRa, that it stores action information, and that it does not store the service data DS. . The communication device 14B differs from the communication device 14A in that it communicates with the server device 10 under the control of the processing device 11B. The communication device 14B receives the image signal Sa transmitted from the server device 10 via the network NW.

表示制御部15は、表示装置又はテレビジョン受像機30の作動制御を行う。表示制御部15は、画像信号Saの示す動画を表示装置又はテレビジョン受像機30に表示させる。また、表示制御部15は、コメント生成機能により生成したコメントの画像を動画に対するオーバレイ用の画像として生成し、動画のフレームに当該オーバレイ用の画像を重ねて表示装置又はテレビジョン受像機30に表示させる。なお、コメントの表示は、動画の視聴中にリアルタイムで行われる態様には限定されず、動画の視聴終了後に行われてもよい。 The display control unit 15 controls the operation of the display device or the television receiver 30 . The display control unit 15 causes the display device or the television receiver 30 to display the moving image indicated by the image signal Sa. In addition, the display control unit 15 generates an image of the comment generated by the comment generation function as an overlay image for the moving image, and displays the overlay image on the frame of the moving image on the display device or the television receiver 30. Let It should be noted that the comment display is not limited to being performed in real time while viewing the moving image, and may be performed after viewing the moving image.

図7は第2実施形態の処理装置11Bの機能を示す機能ブロック図である。処理装置11Bは記憶装置12Bから制御プログラムPRbを読み取り実行することによって、キーワード生成部110B、特定部120、コメント生成部130、及び調整部140として機能する。また、第2実施形態の処理装置11Bにおいては、記憶装置12Bに記憶されている行動情報がキーワード生成部110B及び特定部120に与えられる。 FIG. 7 is a functional block diagram showing functions of the processing device 11B of the second embodiment. The processing device 11B functions as a keyword generation unit 110B, a specification unit 120, a comment generation unit 130, and an adjustment unit 140 by reading and executing the control program PRb from the storage device 12B. Further, in the processing device 11B of the second embodiment, the action information stored in the storage device 12B is provided to the keyword generating section 110B and the specifying section 120. FIG.

図7に示されるようにキーワード生成部110Bは、決定部111、特徴量生成部112、抽出部113B、及び変換部114を備える。抽出部113Bには、ネットワークNWを介して受信した画像信号Saが供給される。画像信号Saは複数のフレームから構成される。画像信号SaはサービスデータDSを伸長して得られた信号であるから、画像信号Saの表す各フレームには、Iフレーム、Pフレーム及びBフレームの区別はない。抽出部113Bは、画像信号Saの表す各フレームの画像から決定部111により決定された種類の物体の画像を抽出する点で第1実施形態の抽出部113Aと相違する。 As shown in FIG. 7, the keyword generation unit 110B includes a determination unit 111, a feature amount generation unit 112, an extraction unit 113B, and a conversion unit 114. The image signal Sa received via the network NW is supplied to the extraction unit 113B. The image signal Sa is composed of a plurality of frames. Since the image signal Sa is a signal obtained by decompressing the service data DS, each frame represented by the image signal Sa does not distinguish between I-frames, P-frames and B-frames. The extraction unit 113B is different from the extraction unit 113A of the first embodiment in that it extracts an image of the type of object determined by the determination unit 111 from the image of each frame represented by the image signal Sa.

次に、第2実施形態のユーザ装置20の動作について説明する。図8は、第2実施形態のユーザ装置20の動作を示すフローチャートである。第2実施形態のユーザ装置20において処理装置11Bは、図7に示すステップS1、S2、S3、S4B、S5、S6及びS7の各処理をこの順に実行する。処理装置11Bは、ステップS1の処理において調整部140として機能する。ただし、ユーザ装置20は、サーバ装置10に比較して処理能力の低いCPUを有するため、ステップS1において処理装置11Bは、特定部120の処理能力は低いと判定し、レベル3を示す第1制御情報SDaと、レベル1を示す第2制御情報SDbと、を生成する。 Next, operation of the user device 20 of the second embodiment will be described. FIG. 8 is a flow chart showing the operation of the user device 20 of the second embodiment. In the user device 20 of the second embodiment, the processing device 11B executes steps S1, S2, S3, S4B, S5, S6 and S7 shown in FIG. 7 in this order. The processing device 11B functions as the adjusting section 140 in the process of step S1. However, since the user device 20 has a CPU with lower processing power than the server device 10, the processing device 11B determines that the processing power of the identification unit 120 is low in step S1, and the first control indicating level 3 Information SDa and second control information SDb indicating level 1 are generated.

ステップS2からステップS5の処理においてキーワード生成部110Bとして機能する。より詳細には、処理装置11Bは、ステップS2の処理において決定部111として機能し、ステップS3の処理において特徴量生成部112として機能し、ステップS4Bの処理において抽出部113Bとして機能し、ステップS5の処理において変換部114として機能する。本動作例では、ステップS1にて生成される第1制御情報SDaはレベル3を示すため、ステップS2における絞り込みの程度は高くなる。また、ステップS4Bの処理では、処理装置11Bは、ステップS3にて読み出した特徴量に基づいて、画像信号Saの示す動画の複数のフレームの各々から物体の画像を抽出する。1フレームの画像には複数の物体の画像が存在するのが通常であるため、処理装置11Bは、ステップS4Bの処理において複数の物体の画像を抽出する。 It functions as the keyword generator 110B in the processing from step S2 to step S5. More specifically, the processing device 11B functions as the determination unit 111 in the process of step S2, functions as the feature amount generation unit 112 in the process of step S3, functions as the extraction unit 113B in the process of step S4B, and functions as the extraction unit 113B in the process of step S5. It functions as the conversion unit 114 in the processing of . In this operation example, the first control information SDa generated in step S1 indicates level 3, so the degree of narrowing down in step S2 is high. Further, in the process of step S4B, the processing device 11B extracts an image of the object from each of the plurality of frames of the moving image indicated by the image signal Sa, based on the feature amount read out in step S3. Since images of a plurality of objects usually exist in one frame image, the processing device 11B extracts images of a plurality of objects in the process of step S4B.

さらに、処理装置11Bは、ステップS6の処理において特定部120として機能し、ステップS7の処理おいてコメント生成部130として機能する。処理装置11Bは、ステップS7の処理により生成したコメントを、表示制御部15を用いて、表示装置又はテレビジョン受像機30に表示させる。本動作例では、ステップS1にて生成される第2制御情報SDbはレベル1を示すため、ステップS6における絞り込みの程度は低くなり、特定部120の処理負荷は低くなる。 Furthermore, the processing device 11B functions as the specifying unit 120 in the process of step S6, and functions as the comment generation unit 130 in the process of step S7. The processing device 11B causes the display device or the television receiver 30 to display the comment generated by the processing of step S7 using the display control unit 15 . In this operation example, the second control information SDb generated in step S1 indicates level 1, so the degree of narrowing down in step S6 is low, and the processing load on the identification unit 120 is low.

本実施形態のユーザ装置20は、コメント生成機能を有する情報処理装置、すなわち本発明の情報処理装置、の一例である。ユーザ装置20は、ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部110Bを備える。また、ユーザ装置20は、行動情報と第2の絞り込みの程度とに基づいて、コメントの対象となる一又は複数の対象キーワードをキーワード生成部110Bによって生成された複数の候補キーワードから特定する特定部120を備える。さらに、ユーザ装置20は、一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを生成するコメント生成部130と、キーワード生成部110Bにおいて複数の画像を絞り込む程度(第1の絞り込みの程度)と、特定部120において複数の候補キーワードを絞り込む程度(第2の絞り込みの程度)とを、キーワード生成部110B及び特定部120の処理に関する処理情報に応じて調整する調整部140と、を備える。 The user device 20 of this embodiment is an example of an information processing device having a comment generation function, that is, an information processing device of the present invention. The user device 20 identifies images of a plurality of objects from the moving image based on the behavior information indicating the behavior history of the user and the degree of the first narrowing down, and candidates for comments on each of the identified images. A keyword generation unit 110B that generates a candidate keyword that becomes Also, the user device 20 is a specifying unit that specifies one or a plurality of target keywords to be commented from a plurality of candidate keywords generated by the keyword generating unit 110B, based on the behavior information and the degree of the second narrowing down. 120. Furthermore, for each of one or a plurality of target keywords, the user device 20 includes the comment generation unit 130 that generates comments related to the target keyword, and the keyword generation unit 110B that narrows down the plurality of images (first narrowing down). degree) and the degree of narrowing down a plurality of candidate keywords in the identifying unit 120 (second degree of narrowing down) according to processing information about the processing of the keyword generating unit 110B and the identifying unit 120; Prepare.

この態様によれば、特定部120の処理能力に応じてキーワード生成部110Bにおける絞り込みの程度と特定部120における絞り込みの程度とを調整することができる。第2実施形態のユーザ装置20では、特定部120の処理能力が低いため、キーワード生成部110Bにおける絞り込みの程度は高く、特定部120における絞り込みの程度は低く調整される。 According to this aspect, the degree of narrowing down in the keyword generation unit 110</b>B and the degree of narrowing down in the specifying unit 120 can be adjusted according to the processing capability of the specifying unit 120 . In the user device 20 of the second embodiment, since the processing capability of the specifying unit 120 is low, the degree of narrowing down in the keyword generating unit 110B is adjusted to be high, and the degree of narrowing down in the specifying unit 120 is adjusted to be low.

[3.第3実施形態]
図9は、第3実施形態のサービスシステム1に含まれるサーバ装置10のハードウェア構成例を示す図である。サーバ装置10は、処理装置11C、記憶装置12C、通信装置14C(第2通信装置)、及びバス19を具備する。処理装置11C、記憶装置12C、及び通信装置14Cの各々は、第1実施形態における処理装置11A、記憶装置12A、及び通信装置14Aの各々に対応する。記憶装置12Cは、制御プログラムPRaに代えて制御プログラムPRcを記憶している点と、特徴量テーブルTBLaを記憶していない点と、で記憶装置12Aと相違する。通信装置14Cは、処理装置11Cによる制御の下、画像信号Saとコメントとをユーザ装置20に送信する点では通信装置14Aと共通である。しかし、通信装置14Cは、キーワード生成部110Bにおける処理に関する処理情報及び行動情報をユーザ装置20から受信する点と、第1制御情報SDaをユーザ装置20へ送信する点と、で通信装置14Aと相違する。
[3. Third Embodiment]
FIG. 9 is a diagram showing a hardware configuration example of the server device 10 included in the service system 1 of the third embodiment. The server device 10 comprises a processing device 11C, a storage device 12C, a communication device 14C (second communication device), and a bus 19 . Each of the processing device 11C, the storage device 12C, and the communication device 14C corresponds to each of the processing device 11A, the storage device 12A, and the communication device 14A in the first embodiment. The storage device 12C differs from the storage device 12A in that the control program PRc is stored in place of the control program PRa and the feature amount table TBLa is not stored. The communication device 14C is common to the communication device 14A in that it transmits the image signal Sa and the comment to the user device 20 under the control of the processing device 11C. However, the communication device 14C differs from the communication device 14A in that it receives from the user device 20 processing information and action information relating to the processing in the keyword generation unit 110B, and in that it transmits the first control information SDa to the user device 20. do.

図10は、第3実施形態のサーバ装置10の機能を示す機能ブロック図である。処理装置11Cは記憶装置12Cから制御プログラムPRcを読み取り実行することによって、特定部120、コメント生成部130、及び調整部140として機能する。また、第3実施形態のサーバ装置10は、ネットワークNWを介してユーザ装置20から送信されてくる処理情報が調整部140に与えられる点と、調整部140により生成された第1制御情報SDaがネットワークNWを介してユーザ装置20へ送信される点と、で第1実施形態のサーバ装置10と相違する。 FIG. 10 is a functional block diagram showing functions of the server device 10 of the third embodiment. The processing device 11C functions as a specifying unit 120, a comment generating unit 130, and an adjusting unit 140 by reading and executing the control program PRc from the storage device 12C. Further, in the server device 10 of the third embodiment, the processing information transmitted from the user device 20 via the network NW is given to the adjustment unit 140, and the first control information SDa generated by the adjustment unit 140 is It differs from the server device 10 of the first embodiment in that it is transmitted to the user device 20 via the network NW.

図11は、第3実施形態のサービスシステム1に含まれるユーザ装置20のハードウェア構成例を示す図である。ユーザ装置20は、処理装置11D、記憶装置12D、通信装置(第1通信装置)14D、表示制御部15、及びバス19を具備する。処理装置11D、記憶装置12D、及び通信装置14Dの各々は、第2実施形態における処理装置11B、記憶装置12B、及び通信装置14Bの各々に対応する。記憶装置12Dは、制御プログラムPRbに代えて制御プログラムPRdを記憶している点と、コメントテーブルTBLbを記憶していない点と、で記憶装置12Bと相違する。通信装置14Dは、処理装置11Dによる制御の下、画像信号Saをサーバ装置10から受信する点では通信装置14Bと共通である。しかし、通信装置14Dは、キーワード生成部110Bにおける処理に関する処理情報、行動情報及び複数の候補キーワードKWをサーバ装置10へ送信する点と、第1制御情報SDaとコメントとをサーバ装置10から受信する点と、で通信装置14Bと相違する。 FIG. 11 is a diagram showing a hardware configuration example of the user device 20 included in the service system 1 of the third embodiment. The user device 20 includes a processing device 11D, a storage device 12D, a communication device (first communication device) 14D, a display control section 15, and a bus 19. FIG. Each of the processing device 11D, the storage device 12D, and the communication device 14D corresponds to each of the processing device 11B, the storage device 12B, and the communication device 14B in the second embodiment. The storage device 12D differs from the storage device 12B in that it stores the control program PRd instead of the control program PRb and that it does not store the comment table TBLb. The communication device 14D is common to the communication device 14B in that it receives the image signal Sa from the server device 10 under the control of the processing device 11D. However, the communication device 14D transmits to the server device 10 processing information, action information, and a plurality of candidate keywords KW relating to the processing in the keyword generation unit 110B, and receives first control information SDa and comments from the server device 10. It differs from the communication device 14B in one point.

図12は、第3実施形態のユーザ装置20の機能を示す機能ブロック図である。処理装置11Dは記憶装置12Dから制御プログラムPRdを読み取り実行することによって、キーワード生成部110Bとして機能する。また、第3実施形態のユーザ装置20は、ネットワークNWを介してサーバ装置10に処理情報を送信する点と、ネットワークを介してサーバ装置10から送信されてくる第1制御情報SDaがキーワード生成部110Bに与えられる点と、で第2実施形態のユーザ装置20と相違する。 FIG. 12 is a functional block diagram showing functions of the user device 20 of the third embodiment. The processing device 11D functions as a keyword generator 110B by reading and executing the control program PRd from the storage device 12D. Further, the user device 20 of the third embodiment transmits processing information to the server device 10 via the network NW, and the first control information SDa transmitted from the server device 10 via the network is a keyword generator. 110B is different from the user device 20 of the second embodiment.

次に、第3実施形態のサーバ装置10及びユーザ装置20の動作について説明する。図13は、第3実施形態のサーバ装置10及びユーザ装置20の各々の動作を示すフローチャートである。第3実施形態のユーザ装置20において処理装置11Dは、図7に示すステップS1_1、S2、S3、S4B、及びS5の各処理をこの順に実行する。一方、第3実施形態のサーバ装置10において処理装置11Cは、図12に示すステップS1、S6、及びS7の各処理をこの順に実行する。 Next, operations of the server device 10 and the user device 20 of the third embodiment will be described. FIG. 13 is a flow chart showing operations of the server device 10 and the user device 20 of the third embodiment. In the user device 20 of the third embodiment, the processing device 11D executes steps S1_1, S2, S3, S4B, and S5 shown in FIG. 7 in this order. On the other hand, in the server device 10 of the third embodiment, the processing device 11C executes steps S1, S6, and S7 shown in FIG. 12 in this order.

ステップS1_1の処理では、処理装置11Dは、キーワード生成部110Bの処理に関する処理情報と記憶装置12Dに記憶されている行動情報とを、ネットワークNWを介してサーバ装置10へ送信する。 In the process of step S1_1, the processing device 11D transmits the processing information regarding the processing of the keyword generating section 110B and the action information stored in the storage device 12D to the server device 10 via the network NW.

サーバ装置10では、行動情報及び処理情報の受信を契機としてステップS1の処理が実行される。ステップS1の処理において、処理装置11Cは、調整部140として機能する。ユーザ装置20から受信した処理情報はキーワード生成部110Bの処理能力を示す。前述したように、ユーザ装置20の処理能力はサーバ装置10の処理能力に比較して低く、ユーザ装置20においてキーワード生成部110Bに割り当て可能なリソースもサーバ装置10において特定部120の機能に割り当て可能なリソースよりも少ない。ステップS1において処理装置11Dは、特定部120の処理能力が高いと判定し、レベル1を示す第1制御情報SDaと、レベル3を示す第2制御情報SDbと、を生成する。ステップS1の処理により生成された第1制御情報SDaはネットワークNWを介してユーザ装置20へ送信される。 In the server device 10, the processing of step S1 is executed with the reception of the action information and the processing information as a trigger. In the process of step S1, the processing device 11C functions as the adjusting section 140. FIG. The processing information received from the user device 20 indicates the processing capability of the keyword generator 110B. As described above, the processing capability of the user device 20 is lower than the processing capability of the server device 10, and resources that can be allocated to the keyword generation unit 110B in the user device 20 can also be allocated to the function of the identification unit 120 in the server device 10. resources. In step S1, the processing device 11D determines that the processing capability of the identifying unit 120 is high, and generates first control information SDa indicating level 1 and second control information SDb indicating level 3. FIG. The first control information SDa generated by the process of step S1 is transmitted to the user device 20 via the network NW.

ユーザ装置20では、サーバ装置10から送信されてくる第1制御情報SDaの受信を契機としてステップS2以降の処理が実行される。ステップS2からステップS5の処理において、処理装置11Dは、キーワード生成部110Bとして機能する。より詳細には、処理装置11Dは、ステップS2の処理において決定部111として機能し、ステップS3の処理において特徴量生成部112として機能し、ステップS4Bの処理において抽出部113Bとして機能し、ステップS5の処理において変換部114として機能する。ステップS5の処理により生成された候補キーワードKWは、ネットワークNWを介してサーバ装置10へ送信される。本動作例においてサーバ装置10からユーザ装置20へ送信される第1制御情報SDaはレベル1を示すため、ステップS2における絞り込みの程度は低く、キーワード生成部110Bの処理負荷は低くなる。 In the user device 20, the processing from step S2 onward is executed with the reception of the first control information SDa transmitted from the server device 10 as a trigger. In the processing from step S2 to step S5, the processing device 11D functions as the keyword generation section 110B. More specifically, the processing device 11D functions as the determination unit 111 in the processing of step S2, functions as the feature amount generation unit 112 in the processing of step S3, functions as the extraction unit 113B in the processing of step S4B, and functions as the extraction unit 113B in the processing of step S4B. It functions as the conversion unit 114 in the processing of . The candidate keyword KW generated by the process of step S5 is transmitted to the server device 10 via the network NW. In this operation example, since the first control information SDa transmitted from the server device 10 to the user device 20 indicates level 1, the degree of narrowing down in step S2 is low, and the processing load on the keyword generation unit 110B is low.

サーバ装置10では、ユーザ装置20から送信されてくる候補キーワードKWの受信を契機としてステップS6以降の処理が実行される。処理装置11Cは、ステップS6の処理において特定部120として機能し、ステップS7の処理おいてコメント生成部130として機能する。ステップS7の処理により生成されたコメントは電子メール等でサーバ装置10からユーザ装置20へ送信される。ユーザ装置20は、電子メール等によりコメントを受信すると、当該コメントの画像を表示装置又はテレビジョン受像機に表示させる。本動作例では、ステップS1においてレベル3を示す第2制御情報SDbが生成されるため、ステップS6における絞り込みの程度は高く、特定部120の処理負荷は高くなる。 In the server device 10, when the candidate keyword KW transmitted from the user device 20 is received, the process from step S6 onwards is executed. 11 C of processing apparatuses function as the specific part 120 in the process of step S6, and function as the comment production|generation part 130 in the process of step S7. The comment generated by the process of step S7 is transmitted from the server device 10 to the user device 20 by e-mail or the like. When receiving a comment by e-mail or the like, the user device 20 displays an image of the comment on a display device or a television receiver. In this operation example, since the second control information SDb indicating level 3 is generated in step S1, the degree of narrowing down in step S6 is high, and the processing load on the identification unit 120 is high.

本実施形態のサービスシステム1は、コメント生成機能を有する情報処理システム、すなわち本発明の情報処理システム、の一例であり、ユーザが管理するユーザ装置20と、サーバ装置10とを備える。ユーザ装置20は、ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部110Bと、行動情報、キーワード生成部110Bによって生成された複数の候補キーワード、及びキーワード生成部110Bの処理に関する処理情報をサーバ装置10へ送信し、サーバ装置10から送信されるコメントを受信する通信装置14D(第1通信装置)と、コメントを表示装置に表示させる表示制御部15と、を備える。サーバ装置10は、ユーザ装置20から送信される行動情報、キーワード生成部110Bによって生成された複数の候補キーワード及びキーワード生成部110Bの処理に関する処理情報を受信し、コメントをユーザ装置20へ送信する通信装置14C(第2通信装置)と、行動情報と第2の絞り込みの程度とに基づいて、コメントの対象となる一又は複数の対象キーワードを複数の候補キーワードから特定する特定部120と、一又は複数の対象キーワードの各々について、関連するコメントを生成するコメント生成部130と、キーワード生成部110Bにおいて複数の画像を絞り込む程度(第1の絞り込みの程度)と、特定部120において複数の候補キーワードを絞り込む程度(第2の絞り込みの程度)と、をキーワード生成部110Bの処理に関する処理情報及び特定部120の処理に関する処理情報に応じて調整する調整部140とを備える。 The service system 1 of this embodiment is an example of an information processing system having a comment generation function, that is, an information processing system of the present invention, and includes a user device 20 managed by a user and a server device 10 . The user device 20 identifies images of a plurality of objects from the moving image based on the behavior information indicating the behavior history of the user and the degree of the first narrowing down, and candidates for comments on each of the identified images. A keyword generation unit 110B that generates a candidate keyword that becomes, action information, a plurality of candidate keywords generated by the keyword generation unit 110B, and processing information related to the processing of the keyword generation unit 110B are transmitted to the server device 10, and the server device 10 and a communication device 14D (first communication device) that receives comments transmitted from and a display control unit 15 that displays the comments on the display device. The server device 10 receives action information transmitted from the user device 20, a plurality of candidate keywords generated by the keyword generation unit 110B, and processing information related to the processing of the keyword generation unit 110B, and transmits comments to the user device 20. a device 14C (second communication device); a specifying unit 120 that specifies one or more target keywords to be commented from a plurality of candidate keywords based on the behavior information and the degree of the second narrowing down; For each of a plurality of target keywords, a comment generating unit 130 that generates related comments, a degree of narrowing down a plurality of images in the keyword generating unit 110B (a first degree of narrowing down), and a plurality of candidate keywords in the specifying unit 120 are selected. The adjusting unit 140 adjusts the degree of narrowing down (second degree of narrowing down) according to the processing information regarding the processing of the keyword generating unit 110B and the processing information regarding the processing of the identifying unit 120. FIG.

この態様によれば、ユーザ装置20が有するキーワード生成部110Bの処理能力とサーバ装置10が有する特定部120の処理能力とに応じてキーワード生成部110Bにおける絞り込みの程度と特定部120における絞り込みの程度とを調整することができる。第3実施形態のサービスシステム1では、キーワード生成部110Bの処理能力は特定部120の処理能力よりも低いため、キーワード生成部110Bにおける絞り込みの程度は低く、特定部120における絞り込みの程度は高く調整され、コメントの的確性を向上させることができる。 According to this aspect, the degree of narrowing down in the keyword generating unit 110B and the degree of narrowing down in the identifying unit 120 are according to the processing ability of the keyword generating unit 110B of the user device 20 and the processing ability of the identifying unit 120 of the server device 10. and can be adjusted. In the service system 1 of the third embodiment, the keyword generation unit 110B has a lower processing capacity than the identification unit 120, so the degree of narrowing down in the keyword generation unit 110B is low, and the degree of narrowing down in the identification unit 120 is adjusted to be high. and can improve the relevance of comments.

[4.変形例]
本発明は、以上に例示した各実施形態に限定されない。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を併合してもよい。
[4. Modification]
The present invention is not limited to the embodiments exemplified above. Specific modification modes are exemplified below. Two or more aspects arbitrarily selected from the following examples may be combined.

(1)上述した第1実施形態において抽出部113AがサービスデータDSから物体の画像を抽出するフレームは以下のフレームであってもよい。
第1に、抽出部113Aは、画像内の複数のフレームのうち、視聴率の高いフレームで物体の画像を抽出してもよい。この場合、抽出部113Aは、視聴率を外部装置からリアルタイムで取得すればよい。具体的には、抽出部113Aは、取得した視聴率が所定の視聴率を超えたフレームで物体の画像の抽出を実行する。視聴率が高いフレームは、他のフレームと比較してユーザUの関心が他の高いと推定される。従って、ユーザUの関心が高いフレームの画像から物体の画像が抽出されるので、ユーザUに有益なコメントを生成できる。
第2に、抽出部113Aは、ユーザUの音声信号をユーザ装置20から受信し、音声信号に基づいて、ユーザUの反応が良いフレームからオブジェクト画像を抽出してもよい。例えば、ユーザUが歓声をあげたフレームからオブジェクト画像を抽出してもよい。
第3に、抽出部113Aは、番組情報に基づいて番組の主題となるフレームでオブジェクト画像を抽出してもよい。例えば、抽出部113Aは、サービスデータDSを解析し、番組の主題となるフレームを特定してもよい。この場合、抽出部113Aは、ネットワークNWを介して外部装置から番組情報を取得すればよい。
同様に第2実施形態及び第3実施形態において抽出部113Bが画像信号Saから物体の画像を抽出する対象とするフレームも、視聴率の高いフレーム、ユーザUの反応が良いフレーム、又は番組の主題となるフレームであってもよい。
(1) In the above-described first embodiment, the frames from which the extraction unit 113A extracts the image of the object from the service data DS may be the following frames.
First, the extraction unit 113A may extract the image of the object in a frame with a high audience rating among the plurality of frames in the image. In this case, the extraction unit 113A may acquire the audience rating from the external device in real time. Specifically, the extraction unit 113A extracts an image of an object from a frame in which the obtained audience rating exceeds a predetermined audience rating. A frame with a high audience rating is presumed to be of high interest to the user U compared to other frames. Therefore, since the image of the object is extracted from the image of the frame in which the user U is highly interested, a comment beneficial to the user U can be generated.
Secondly, the extraction unit 113A may receive the audio signal of the user U from the user device 20, and extract the object image from the frame to which the user U responds well based on the audio signal. For example, an object image may be extracted from a frame in which the user U cheers.
Thirdly, the extraction unit 113A may extract an object image in a frame that is the theme of the program based on the program information. For example, the extraction unit 113A may analyze the service data DS and identify frames that are the subject of the program. In this case, the extraction unit 113A may acquire program information from the external device via the network NW.
Similarly, in the second and third embodiments, the extraction unit 113B extracts the image of the object from the image signal Sa. It may be a frame that becomes

(2)調整部140は、処理能力の替わりに又は処理能力に加えて動画の品質に応じて、決定部111における絞り込みの程度(第1の絞り込みの程度)と、特定部120における絞り込みの程度(第2の絞り込みの程度)とを調整してもよい。動画の品質は処理情報に含まれる。動画の品質の具体例としては、動画のフレームレート、又は動画の各フレームにおける解像度が挙げられる。処理情報が動画の品質を含む場合、調整部140は、動画の品質が高い場合、動画の品質が低い場合と比較して、キーワード生成部において複数の画像を絞り込む程度を小さくさせ、特定部において複数の候補キーワードを絞り込む程度を大きくさせる。動画の品質が高い場合には、キーワード生成部の処理負荷が、動画の品質が低い場合と比較して、高くなるからである。 (2) The adjustment unit 140 adjusts the degree of narrowing down (first degree of narrowing down) in the determining unit 111 and the degree of narrowing down in the specifying unit 120 according to the quality of the moving image instead of or in addition to the processing power. (degree of second narrowing down) may be adjusted. Video quality is included in the processing information. A specific example of the quality of the moving image is the frame rate of the moving image or the resolution of each frame of the moving image. When the processing information includes the quality of the moving image, the adjustment unit 140 reduces the extent to which the plurality of images are narrowed down in the keyword generation unit compared to when the quality of the moving image is high and when the quality of the moving image is low. Increase the degree of narrowing down multiple candidate keywords. This is because the processing load on the keyword generation unit is higher when the quality of the moving image is high than when the quality of the moving image is low.

(3)上記1実施形態では、行動情報に基づいて特定された物体の画像から変換されるキーワードをそのまま候補キーワードとした。しかし、キーワード生成部110Aにおける絞り込みでは、行動情報に基づいて特定された物体の画像から変換されるキーワードの上位概念を当該キーワードに替えて又は当該キーワードに加えて候補キーワードとし、特定部120における絞り込みで下位概念に絞り込んでもよい。例えば、行動情報に基づいて特定された物体の画像から変換されるキーワードが「SUV」(Sport Utility Vehicle)であった場合、キーワード生成部110Aにおける絞り込みでは「SUV」の上位概念である「車」を、「SUV」と共に又は「SUV」に代えて候補キーワードとし、特定部120における絞り込みで対象キーワードを「SUV」に絞り込めばよい。また、行動情報に基づいて特定された物体の画像から変換されるキーワードが「薔薇」であった場合、キーワード生成部110Aにおける絞り込みでは「薔薇」の上位概念である「花」を、「薔薇」と共に又は「薔薇」に代えて候補キーワードとし、特定部120における絞り込みで対象キーワードを「薔薇」に絞り込めばよい。なお、上位概念化の程度については、キーワード生成部110Aの処理能力に応じて調整すればよい。また、キーワード生成部110Bにおける絞り込みについても同様に上位概念化が採用されてもよい。 (3) In the above embodiment, the keyword converted from the image of the object specified based on the action information is directly used as the candidate keyword. However, in the narrowing down by the keyword generating unit 110A, the broader concept of the keyword converted from the image of the object identified based on the action information is used as a candidate keyword instead of or in addition to the keyword, and the narrowing down in the identifying unit 120 is performed. can be narrowed down to subordinate concepts. For example, if the keyword converted from the image of the object specified based on the action information is "SUV" (Sport Utility Vehicle), the narrowing down by the keyword generation unit 110A will be "car" which is a superordinate concept of "SUV". is used as a candidate keyword together with or instead of "SUV", and the target keyword is narrowed down to "SUV" by narrowing down in the specifying unit 120. FIG. Further, when the keyword converted from the image of the object specified based on the action information is "rose", the keyword generation unit 110A narrows down "flower", which is a superordinate concept of "rose", to "rose". The target keyword may be narrowed down to "rose" by using a candidate keyword together with or instead of "rose" and narrowing down in the specifying unit 120. FIG. It should be noted that the degree of hyper-conceptualization may be adjusted according to the processing capability of the keyword generating section 110A. In addition, for the narrowing down in the keyword generation unit 110B, the hypernymization may be similarly adopted.

(4)上記第1実施形態及び第3実施形態では、コメントは電子メール等によりサーバ装置10からユーザ装置20へ送信された。しかし、コメントがオーバレイされた画像信号Saがサーバ装置10からユーザ装置20へ送信されてもよい。また、コメントの表示はリアルタイムでの表示には限定されず、動画の視聴が終了した後に行われてもよい。 (4) In the first and third embodiments, comments are sent from the server device 10 to the user device 20 by e-mail or the like. However, the image signal Sa overlaid with the comment may be transmitted from the server device 10 to the user device 20 . Moreover, the display of the comment is not limited to real-time display, and may be performed after the viewing of the moving image is finished.

(5)本発明の情報処理装置の一例として、上記第1実施形態ではサーバ装置10が挙げられ、上記第2実施形態ではユーザ装置20が挙げられていた。しかし、本発明の情報処理装置は、ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部と、行動情報と第2の絞り込みの程度とに基づいて、コメントの対象となる一又は複数の対象キーワードをキーワード生成部によって生成された複数の候補キーワードから特定する特定部と、一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを生成するコメント生成部と、キーワード生成部において複数の画像を絞り込む程度(第1の絞り込みの程度)と、特定部において複数の候補キーワードを絞り込む程度(第2の絞り込みの程度)とを、前記キーワード生成部及び前記特定部の処理に関する処理情報に応じて調整する調整部とを備えていればよく、サーバ装置又はユーザ装置には限定されない。 (5) As an example of the information processing apparatus of the present invention, the server device 10 was mentioned in the first embodiment, and the user device 20 was mentioned in the second embodiment. However, the information processing apparatus of the present invention identifies images of a plurality of objects from a moving image based on behavior information indicating a user's behavior history and the degree of first narrowing down, and for each of the identified plurality of images, A keyword generation unit that generates candidate keywords that are candidates for comments, and one or more target keywords that are targets for comments are generated by the keyword generation unit based on the behavior information and the degree of second narrowing down. A specifying unit that specifies from a plurality of candidate keywords, a comment generating unit that generates comments related to each of one or more target keywords, and a degree of narrowing down a plurality of images in the keyword generating unit (first degree of narrowing down) and degree of narrowing down the plurality of candidate keywords in the specifying unit (second degree of narrowing down) according to processing information relating to the processing of the keyword generating unit and the specifying unit. It is not limited to the server device or the user device.

例えば、動画配信サーバから送信される画像信号Saをユーザ装置へ中継する中継装置(スイッチングハブ、ルータ又はゲートウェイ等)が、キーワード生成部、特定部、コメント生成部及び調整部を備えていてもよい。この中継装置によれば、動画配信サーバから送信された画像信号Saに、コメント生成部により生成したコメントの画像をオーバレイしてユーザ装置へ転送することができる。また、この中継装置によれば、特定部の処理能力に応じてキーワード生成部における絞り込みの程度と特定部における絞り込みの程度とを調整することができる。 For example, a relay device (switching hub, router, gateway, etc.) that relays the image signal Sa transmitted from the video distribution server to the user device may include a keyword generation unit, a specification unit, a comment generation unit, and an adjustment unit. . According to this relay device, the image signal Sa transmitted from the moving image distribution server can be overlaid with the image of the comment generated by the comment generation unit and transferred to the user device. Further, according to this relay device, it is possible to adjust the degree of narrowing down in the keyword generating unit and the degree of narrowing down in the identifying unit according to the processing capability of the identifying unit.

また、コメント生成機能を有するサーバ装置、すなわち本発明のサーバ装置は、上記キーワード生成部、特定部、コメント生成部及び調整部を有する情報処理装置と、ユーザが管理するユーザ装置から送信される行動情報を受信し、コメントをユーザ装置へ送信する通信装置と、を備えていればよい。同様に、コメント生成機能を有するユーザ装置、すなわち本発明のユーザ装置は、上記キーワード生成部、特定部、コメント生成部及び調整部を有する情報処理装置と、コメントを表示装置に表示させる表示制御部と、を備えていればよい。 A server device having a comment generation function, that is, the server device of the present invention includes an information processing device having the keyword generation unit, the specification unit, the comment generation unit, and the adjustment unit, and an action transmitted from the user device managed by the user. a communication device for receiving information and transmitting comments to the user device. Similarly, a user device having a comment generation function, that is, the user device of the present invention includes an information processing device having the keyword generation unit, the specification unit, the comment generation unit, and the adjustment unit, and a display control unit for displaying the comment on the display device. and .

(6)上述した各実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。例えば、決定部111の機能はネットワークNWを介して接続される他のサーバ装置から提供されてもよい。同様に、特徴量生成部112の機能もネットワークNWを介して接続される他のサーバ装置から提供されてもよく、特徴量テーブルTBLaも他のサーバ装置に設けられてもよい。
また、上述した各実施形態の説明に用いた「装置」という文言は、回路、デバイス又はユニット等の他の用語に読替えてもよい。
(6) The block diagrams used to describe each of the above-described embodiments show blocks for each function. These functional blocks (components) are implemented by any combination of hardware and/or software. Further, means for realizing each functional block is not particularly limited. That is, each functional block may be implemented by one device physically and/or logically coupled, or may be implemented by two or more physically and/or logically separated devices directly and/or indirectly. These multiple devices may be connected together (eg, wired and/or wirelessly). For example, the function of the determination unit 111 may be provided by another server device connected via the network NW. Similarly, the function of the feature quantity generation unit 112 may also be provided by another server device connected via the network NW, and the feature quantity table TBLa may also be provided in another server device.
Also, the term "apparatus" used in the description of each of the above-described embodiments may be replaced with other terms such as circuit, device, or unit.

(7)上述した各実施形態における処理手順、シーケンス、フローチャート等は、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。 (7) As long as there is no contradiction, the order of the processing procedures, sequences, flowcharts, etc. in each of the above-described embodiments may be changed. For example, the methods described herein present elements of the various steps in a sample order, and are not limited to the specific order presented.

(8)上述した各実施形態において、入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 (8) In each of the above-described embodiments, input/output information and the like may be stored in a specific location (for example, memory) or managed in a management table. Input/output information and the like can be overwritten, updated, or appended. The output information and the like may be deleted. The entered information and the like may be transmitted to another device.

(9)上述した各実施形態において、判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 (9) In each of the above-described embodiments, the determination may be made by a value represented by 1 bit (0 or 1), or by a true/false value (Boolean: true or false). and may be performed by numerical comparison (eg, comparison with a predetermined value).

(10)上述した第1実施形態における記憶装置12Aは、処理装置11Aが読取可能な記録媒体であり、ROM及びRAM等を例示したが、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリデバイス(例えば、カード、スティック、キードライブ)、CD-ROM(Compact Disc-ROM)、レジスタ、リムーバブルディスク、ハードディスク、フロッピー(登録商標)ディスク、磁気ストリップ、データベース、サーバその他の適切な記憶媒体である。第2実施形態における記憶装置12B,第3実施形態における記憶装置12C及び記憶装置12Dも、記憶装置12Aと同様である。また、プログラムは、ネットワークNWから送信されても良い。また、プログラムは、電気通信回線を介して通信網から送信されても良い。 (10) The storage device 12A in the first embodiment described above is a recording medium readable by the processing device 11A. Applications discs, Blu-ray (registered trademark) discs), smart cards, flash memory devices (e.g. cards, sticks, key drives), CD-ROMs (Compact Disc-ROMs), registers, removable discs, hard disks, floppies (registered (trademark) disks, magnetic strips, databases, servers, or other suitable storage media. The storage device 12B in the second embodiment, and the storage devices 12C and 12D in the third embodiment are similar to the storage device 12A. Also, the program may be transmitted from the network NW. Also, the program may be transmitted from a communication network via an electric communication line.

(11)上述した各実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G、5G、FRA(Future Radio Access)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi)、IEEE 802.16(WiMAX)、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及び/又はこれらに基づいて拡張された次世代システムに適用されてもよい。 (11) Each of the above-described embodiments is LTE (Long Term Evolution), LTE-A (LTE-Advanced), SUPER 3G, IMT-Advanced, 4G, 5G, FRA (Future Radio Access), W-CDMA (registered trademark) ), GSM (registered trademark), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi), IEEE 802.16 (WiMAX), IEEE 802.20, UWB (Ultra-WideBand), Bluetooth (registered Trademarks), other suitable systems, and/or future generation systems enhanced based on these.

(12)上述した各実施形態において、説明した情報及び信号等は、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上述の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップ等は、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
(12) In each of the embodiments described above, the information, signals, etc. described may be represented using any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description may refer to voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. may be represented by a combination of
The terms explained in this specification and/or terms necessary for understanding this specification may be replaced with terms having the same or similar meanings.

(13)図3、図7、図10、及び図12に例示された各機能は、ハードウェア及びソフトウェアの任意の組合せによって実現される。また、各機能は、単体の装置によって実現されてもよいし、相互に別体で構成された2個以上の装置によって実現されてもよい。 (13) Each function illustrated in FIGS. 3, 7, 10, and 12 is implemented by any combination of hardware and software. Also, each function may be implemented by a single device, or may be implemented by two or more devices configured separately from each other.

(14)上述した各実施形態で例示したプログラムは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード又はハードウェア記述言語と呼ばれるか、他の名称によって呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順又は機能等を意味するよう広く解釈されるべきである。
また、ソフトウェア、命令等は、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)等の有線技術及び/又は赤外線、無線及びマイクロ波等の無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
(14) The programs exemplified in each of the above embodiments, whether referred to as software, firmware, middleware, microcode, hardware description language, or by any other name, may include instructions, instruction sets, code, code segments. , program code, subprograms, software modules, applications, software applications, software packages, routines, subroutines, objects, executable files, threads of execution, procedures or functions, or the like.
Software, instructions, etc. may also be sent and received over a transmission medium. For example, the software may use wired technologies such as coaxial cable, fiber optic cable, twisted pair and Digital Subscriber Line (DSL) and/or wireless technologies such as infrared, radio and microwave to create websites, servers, or other When transmitted from a remote source, these wired and/or wireless technologies are included within the definition of transmission media.

(15)上述した各実施形態において、「システム」及び「ネットワーク」という用語は、互換的に使用される。 (15) In each of the embodiments described above, the terms "system" and "network" are used interchangeably.

(16)上述した各実施形態において、情報、パラメータ等は、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。 (16) In each of the above-described embodiments, information, parameters, etc. may be represented by absolute values, may be represented by relative values from a predetermined value, or may be represented by corresponding separate information. good too.

(17)上述した各実施形態において、ユーザ装置20は、移動局である場合が含まれる。移動局は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、又はいくつかの他の適切な用語で呼ばれる場合もある。 (17) In each of the embodiments described above, the user equipment 20 may be a mobile station. A mobile station is defined by those skilled in the art as a subscriber station, mobile unit, subscriber unit, wireless unit, remote unit, mobile device, wireless device, wireless communication device, remote device, mobile subscriber station, access terminal, mobile terminal, wireless It may also be called a terminal, remote terminal, handset, user agent, mobile client, client, or some other suitable term.

(18)上述した各実施形態において、「接続された(connected)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。本明細書で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及び/又はプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギー等の電磁エネルギーを使用することにより、互いに「接続」されると考えることができる。 (18) in each of the above embodiments, the term "connected" or any variation thereof means any direct or indirect connection or coupling between two or more elements; It can include the presence of one or more intermediate elements between two elements that are "connected" to each other. Connections between elements may be physical, logical, or a combination thereof. As used herein, two elements are referred to by the use of one or more wires, cables and/or printed electrical connections and, as some non-limiting and non-exhaustive examples, radio frequency They can be considered to be "connected" to each other through the use of electromagnetic energy, such as electromagnetic energy having wavelengths in the microwave, light (both visible and invisible) regions.

(19)上述した各実施形態において、「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 (19) In each of the embodiments described above, the phrase "based on" does not mean "based only on," unless expressly specified otherwise. In other words, the phrase "based on" means both "based only on" and "based at least on."

(20)本明細書で使用する「第1」、「第2」等の呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。従って、第1及び第2の要素への参照は、2つの要素のみがそこで採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。 (20) Any reference to elements using the "first," "second," etc. designations used herein does not generally limit the quantity or order of those elements. These designations may be used herein as a convenient method of distinguishing between two or more elements. Thus, references to first and second elements do not imply that only two elements may be employed therein, or that the first element must precede the second element in any way.

(21)上述した各実施形態において「含む(including)」、「含んでいる(comprising)」、及びそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。 (21) To the extent that "including," "comprising," and variations thereof are used in each of the above-described embodiments in the specification or claims, these terms include: Like the term "comprising," it is intended to be inclusive. Furthermore, the term "or" as used in this specification or the claims is not intended to be an exclusive OR.

(22)本願の全体において、例えば、英語におけるa、an及びtheのように、翻訳によって冠詞が追加された場合、これらの冠詞は、文脈から明らかにそうではないことが示されていなければ、複数を含む。 (22) Throughout this application, where articles have been added by translation, e.g. a, an and the in English, these articles shall be used unless the context clearly indicates otherwise. Including multiple.

(23)本発明が本明細書中に説明した実施形態に限定されないことは当業者にとって明白である。本発明は、特許請求の範囲の記載に基づいて定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施できる。従って、本明細書の記載は、例示的な説明を目的とし、本発明に対して何ら制限的な意味を有さない。また、本明細書に例示した態様から選択された複数の態様を組み合わせてもよい。 (23) It will be clear to those skilled in the art that the present invention is not limited to the embodiments described herein. The present invention can be implemented as modifications and changes without departing from the spirit and scope of the present invention determined based on the description of the claims. Accordingly, the description herein is for illustrative purposes only and is not meant to be limiting in any way. Also, a plurality of aspects selected from the aspects exemplified in this specification may be combined.

1…サービスシステム、10…サーバ装置、11A、11B、11C,11D…処理装置、20…ユーザ装置、12A、12B…記憶装置、14A、14B、14C,14D…通信装置、15…表示部、19…バス、110A、110B…キーワード生成部、111…決定部、112…特徴量生成部、113A、113B…抽出部、114…変換部、120…特定部、130…コメント生成部、140…調整部、PRa、PRb、PRc、PRd…制御プログラム、TBLa…特徴量テーブル、TBLb…コメントテーブル、DS…サービスデータ、KW…候補キーワード、KX…対象キーワード。

Reference Signs List 1 service system 10 server device 11A, 11B, 11C, 11D processing device 20 user device 12A, 12B storage device 14A, 14B, 14C, 14D communication device 15 display unit 19 Bus 110A, 110B Keyword generation unit 111 Determination unit 112 Feature amount generation unit 113A, 113B Extraction unit 114 Conversion unit 120 Specification unit 130 Comment generation unit 140 Adjustment unit , PRa, PRb, PRc, PRd... control program, TBLa... feature amount table, TBLb... comment table, DS... service data, KW... candidate keyword, KX... target keyword.

Claims (9)

ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体の画像を動画から特定し、特定された複数の物体の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部と、
前記行動情報と第2の絞り込みの程度に基づいて、コメントの対象となる一又は複数の対象キーワードを前記キーワード生成部によって生成された複数の候補キーワードから特定する特定部と、
前記一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを生成するコメント生成部と、
前記第1の絞り込みの程度と、前記第2の絞り込みの程度とを、前記キーワード生成部及び前記特定部の処理に関する処理情報に応じて調整する調整部と、
を備える情報処理装置。
A plurality of images of objects are specified from a moving image based on action information indicating a user's action history and a degree of first narrowing down, and candidates for commenting on each of the specified images of a plurality of objects. a keyword generation unit that generates keywords;
a specifying unit that specifies one or more target keywords to be commented from a plurality of candidate keywords generated by the keyword generating unit, based on the behavior information and the degree of second narrowing down;
a comment generation unit that generates a comment related to the target keyword for each of the one or more target keywords;
an adjusting unit that adjusts the degree of first narrowing down and the degree of second narrowing down according to processing information related to processing of the keyword generating unit and the specifying unit;
Information processing device.
前記処理情報は、前記特定部の処理能力を含むことを特徴とする請求項1に記載の情報処理装置。 2. The information processing apparatus according to claim 1, wherein said processing information includes processing capability of said specifying unit. 前記調整部は、
前記特定部の処理能力が高い場合、前記処理能力が低い場合と比較して、前記第1の絞り込みの程度を低くさせ、前記第2の絞り込みの程度を高くさせる、
請求項2に記載の情報処理装置。
The adjustment unit
When the processing power of the specific unit is high, compared to when the processing power is low, the degree of the first narrowing down is lowered and the degree of the second narrowing down is raised.
The information processing apparatus according to claim 2.
前記処理情報は、前記動画の品質に関する情報を含むことを特徴とする請求項1に記載の情報処理装置。 2. The information processing apparatus according to claim 1, wherein the processing information includes information regarding quality of the moving image. 前記調整部は、
前記動画の品質が高い場合、前記動画の品質が低い場合と比較して、前記第1の絞り込みの程度を低くさせ、前記第2の絞り込みの程度を高くさせる、
請求項4に記載の情報処理装置。
The adjustment unit
When the quality of the moving image is high, compared to when the quality of the moving image is low, the degree of the first narrowing down is lowered and the degree of the second narrowing down is raised.
The information processing apparatus according to claim 4.
前記調整部は、前記第1の絞り込みの程度を示す制御情報を前記キーワード生成部に出力し、
前記キーワード生成部は、
前記行動情報に基づいて物体に対する前記ユーザの関心の程度を評価した結果と前記制御情報とに基づいて、前記動画から抽出する物体の種類を決定する決定部と、
前記決定部で決定された種類の物体について、当該物体の画像の特徴量を生成する特徴量生成部と、
前記特徴量を有する物体の画像を前記動画から抽出する抽出部と、
を備え、
前記キーワード生成部は、
前記抽出部で抽出された前記物体の画像を前記候補キーワードに変換する変換部と、を備える、
請求項1から5までのうち何れか1項に記載の情報処理装置。
The adjustment unit outputs control information indicating the degree of the first narrowing down to the keyword generation unit,
The keyword generation unit is
a determination unit that determines the type of object to be extracted from the moving image based on the result of evaluating the user's degree of interest in the object based on the behavior information and the control information;
a feature quantity generating unit for generating a feature quantity of an image of the object of the type determined by the determining unit;
an extraction unit that extracts an image of an object having the feature amount from the moving image;
with
The keyword generation unit is
a conversion unit that converts the image of the object extracted by the extraction unit into the candidate keyword;
The information processing apparatus according to any one of claims 1 to 5.
請求項1から6までのうち何れか1項に記載の情報処理装置と、
前記ユーザが管理するユーザ装置から送信される前記行動情報を受信し、前記コメントを前記ユーザ装置へ送信する通信装置と、
を備えるサーバ装置。
an information processing apparatus according to any one of claims 1 to 6;
a communication device that receives the action information transmitted from a user device managed by the user and transmits the comment to the user device;
A server device comprising
請求項1から6までのうち何れか1項に記載の情報処理装置と、
前記コメントを表示装置に表示させる表示制御部と、
を備えるユーザ装置。
an information processing apparatus according to any one of claims 1 to 6;
a display control unit for displaying the comment on a display device;
A user equipment comprising:
ユーザが管理するユーザ装置と、サーバ装置とを備える情報処理システムであって、
前記ユーザ装置は、
前記ユーザの行動履歴を示す行動情報と第1の絞り込みの程度とに基づいて、複数の物体に各々対応する複数の画像を動画から特定し、特定された複数の物体の画像の各々についてコメントの対象の候補となる候補キーワードを生成するキーワード生成部と、
前記行動情報、前記キーワード生成部によって生成された複数の候補キーワード、及び前記キーワード生成部の処理に関する処理情報を前記サーバ装置へ送信し、前記サーバ装置から送信されるコメントを受信する第1通信装置と、
前記コメントを表示装置に表示させる表示制御部とを備え、
前記サーバ装置は、
前記ユーザ装置から送信される前記行動情報、前記複数の候補キーワード及び前記キーワード生成部の処理に関する処理情報を受信し、前記コメントを前記ユーザ装置へ送信する第2通信装置と、
前記行動情報と第2の絞り込みの程度とに基づいてコメントの対象となる一又は複数の対象キーワードを前記複数の候補キーワードから特定する特定部と、
前記一又は複数の対象キーワードの各々について、当該対象キーワードに関連するコメントを前記ユーザ装置に送信するコメントとして生成するコメント生成部と、
前記キーワード生成部において前記複数の画像を絞り込む程度と、前記特定部において前記複数の候補キーワードを前記第1の絞り込みの程度と前記第2の絞り込みの程度とを、前記キーワード生成部の処理に関する処理情報及び前記特定部の処理に関する処理情報に応じて調整する調整部とを備える、
情報処理システム。
An information processing system comprising a user device managed by a user and a server device,
The user device
Based on the action information indicating the action history of the user and the degree of first narrowing down, a plurality of images respectively corresponding to the plurality of objects are specified from the moving image, and a comment is made for each of the specified images of the plurality of objects. a keyword generating unit that generates candidate keywords that are candidates for the target;
A first communication device that transmits the action information, a plurality of candidate keywords generated by the keyword generation unit, and processing information related to processing of the keyword generation unit to the server device, and receives comments transmitted from the server device. When,
A display control unit for displaying the comment on a display device,
The server device
a second communication device that receives the action information, the plurality of candidate keywords, and processing information related to processing of the keyword generation unit transmitted from the user device, and transmits the comment to the user device;
a specifying unit that specifies one or more target keywords to be commented on from the plurality of candidate keywords based on the behavior information and the degree of second narrowing down;
a comment generating unit that generates, for each of the one or more target keywords, a comment related to the target keyword as a comment to be transmitted to the user device;
a degree of narrowing down the plurality of images in the keyword generating unit; an adjustment unit that adjusts according to information and processing information related to processing of the identification unit;
Information processing system.
JP2021508748A 2019-03-27 2019-12-18 Information processing device, server device, user device and information processing system Active JP7158564B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019060660 2019-03-27
JP2019060660 2019-03-27
PCT/JP2019/049566 WO2020194925A1 (en) 2019-03-27 2019-12-18 Information processing device, server device, user device, and information processing system

Publications (2)

Publication Number Publication Date
JPWO2020194925A1 JPWO2020194925A1 (en) 2020-10-01
JP7158564B2 true JP7158564B2 (en) 2022-10-21

Family

ID=72608811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021508748A Active JP7158564B2 (en) 2019-03-27 2019-12-18 Information processing device, server device, user device and information processing system

Country Status (3)

Country Link
US (1) US11800198B2 (en)
JP (1) JP7158564B2 (en)
WO (1) WO2020194925A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222906A (en) 2014-05-23 2015-12-10 シャープ株式会社 Information processing apparatus, information processing system, receiving apparatus, terminal apparatus, information processing method, and information processing program
JP2018112806A (en) 2017-01-10 2018-07-19 大日本印刷株式会社 Image associating apparatus, image database, image retrieval apparatus, image retrieval system and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5593352B2 (en) * 2012-07-10 2014-09-24 ヤフー株式会社 Information providing apparatus, information providing method, and information providing program
JP5940105B2 (en) 2014-02-13 2016-06-29 Necパーソナルコンピュータ株式会社 Information processing apparatus, information processing method, and program
KR102284750B1 (en) * 2014-12-15 2021-08-03 삼성전자주식회사 User terminal device and method for recognizing object thereof
US10939182B2 (en) * 2018-01-31 2021-03-02 WowYow, Inc. Methods and apparatus for media search, characterization, and augmented reality provision

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222906A (en) 2014-05-23 2015-12-10 シャープ株式会社 Information processing apparatus, information processing system, receiving apparatus, terminal apparatus, information processing method, and information processing program
JP2018112806A (en) 2017-01-10 2018-07-19 大日本印刷株式会社 Image associating apparatus, image database, image retrieval apparatus, image retrieval system and program

Also Published As

Publication number Publication date
US20220182733A1 (en) 2022-06-09
JPWO2020194925A1 (en) 2020-10-01
WO2020194925A1 (en) 2020-10-01
US11800198B2 (en) 2023-10-24

Similar Documents

Publication Publication Date Title
KR102130429B1 (en) Method and device for decoding multimedia file
KR101863149B1 (en) Channel navigation in connected media devices through keyword selection
CN104361085B (en) Information recommendation method, device, browser, server and system
EP3012752A1 (en) Information searching apparatus and control method thereof
JP2019008807A (en) System and method for displaying content and related social media data
US20240388745A1 (en) Optimized Content Delivery
US20130283173A1 (en) User-selected media content blocking
CN105808182B (en) Display control method and system, advertisement breach judging device and video and audio processing device
US12520012B2 (en) Systems and methods for enabling a user to generate a plan to access content using multiple content services
CN105721620A (en) Video information push method and device as well as video information display method and device
US9787322B2 (en) Content compression and/or decompression
CN106354797A (en) Data recommendation method and device
KR20160098797A (en) Image processing apparatus, controlling method of image processing apparatus and system
US20240314400A1 (en) Content display method, apparatus, device and medium
JP7158564B2 (en) Information processing device, server device, user device and information processing system
JP7253574B2 (en) Information processing device, server device and information processing system
CN104834728B (en) A kind of method for pushing and device for subscribing to video
CN111031354B (en) Multimedia playing method, device and storage medium
CN112312208A (en) Multimedia information processing method and device, storage medium and electronic equipment
AU2018250286A1 (en) Systems and methods for improving accuracy of device maps using media viewing data
CN106454398A (en) Video processing method and terminal
CN115988257B (en) Data recording method, device and equipment
KR102726891B1 (en) Electronic apparatus for playing substitutional advertisement and method for controlling method thereof
CN113498612B (en) Information communication system, receiver, terminal device, display control method, and nonvolatile storage medium
KR102617410B1 (en) Method and apparatus for providing information on home shopping broadcasting

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220927

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221011

R150 Certificate of patent or registration of utility model

Ref document number: 7158564

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250