WO2023007922A1 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
WO2023007922A1
WO2023007922A1 PCT/JP2022/021018 JP2022021018W WO2023007922A1 WO 2023007922 A1 WO2023007922 A1 WO 2023007922A1 JP 2022021018 W JP2022021018 W JP 2022021018W WO 2023007922 A1 WO2023007922 A1 WO 2023007922A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
action
behavior
data
series data
Prior art date
Application number
PCT/JP2022/021018
Other languages
English (en)
French (fr)
Inventor
央 倉沢
佳徳 礒田
樹 柴田
洋樹 浅井
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to JP2023538296A priority Critical patent/JPWO2023007922A1/ja
Publication of WO2023007922A1 publication Critical patent/WO2023007922A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to an information processing device that processes time-series data indicating user behavior and the like.
  • BERT Bidirectional Encoder Representations from Transformers
  • This BERT has an encoder-decoder model with a self-attention mechanism and performs natural language processing and image processing.
  • the object of the present invention is to provide an information processing apparatus that can reduce the load when handling behavior data such as user behavior in machine learning processing.
  • the information processing apparatus of the present invention includes an acquisition unit that acquires non-important action data from among one or more pieces of action data indicating user actions, and a processing unit that generalizes the non-important action data.
  • FIG. 1 is a system configuration diagram of a communication system including a behavior analysis device 100 that acquires and analyzes user behavior according to the present disclosure
  • FIG. It is a block diagram which shows the functional structure of the behavior-analysis apparatus 100.
  • FIG. It is a schematic diagram which shows the specific example of a generalization process. It is a schematic diagram which shows the insertion process of an action identifier. It is a figure which shows the model which showed BERT typically.
  • 4 is a flowchart showing learning processing of the behavior analysis device 100; 3 is a flowchart showing the processing contents of the behavior analysis device 100.
  • FIG. It is a figure which shows the action log
  • FIG. 10 is a diagram in which the frequencies of user behavior classifications are tabulated for each classification configured in each hierarchy;
  • FIG. 10 is a merged view of the summary tables shown in FIGS. 9 and 10(a) to 10(c);
  • FIG. 11 is a diagram showing 12 classifications with the highest frequency of occurrence taken out from the merged summary table. It is the figure which generalized the action identifier based on the management table (FIG. 12).
  • FIG. 10 is a diagram in which action identifiers indicating delimiters are inserted into generalized action history data based on time intervals between the actions;
  • FIG. 10 is a diagram schematically showing calculation and selection processing of attention weights from the user's action history database 101a.
  • 1 is a diagram illustrating an example of a hardware configuration of a behavior analysis device 100 according to an embodiment of the present disclosure;
  • FIG. 1 is a system configuration diagram of a communication system including a behavior analysis device 100 that acquires and analyzes user behavior according to the present disclosure.
  • This behavior analysis device 100 functions as a time-series data processing device that handles operation history of user's access to a website as time-series data. Also, when the user uses a telephone service of a certain company (such as product consultation or questions), the behavior analysis device 100 treats the usage state as time-series data.
  • the behavior analysis device 100 collects and analyzes the access history to the WEB server 300 by the PC 200 operated by the user to be analyzed.
  • the service operator records the action history and registers it in the action history database 101 a of the action analysis device 100 .
  • the PC 200 is a general personal computer and accesses the WEB server 300 via the network.
  • the WEB server 300 is a server that provides WEB information to the PC 200 .
  • the behavior analysis device 100 collects behavior history data on which information in the WEB server 300 the PC 200 has accessed. For example, when the PC 200 accesses a site of a mobile phone communication company, what kind of information is accessed is collected. More specifically, it collects mobile phone rate plan information and mobile terminal type information.
  • FIG. 2 is a block diagram showing the functional configuration of the behavior analysis device 100.
  • This behavior analysis device 100 includes a behavior history database 101a, a time-series data acquisition unit 101, a generalization processing unit 102, a data processing unit 103, a learning unit 104, a learning model 104a, a BERT processing unit 105, a range selection unit 106, and an output unit. 107.
  • a behavior history database 101a includes a time-series data acquisition unit 101, a generalization processing unit 102, a data processing unit 103, a learning unit 104, a learning model 104a, a BERT processing unit 105, a range selection unit 106, and an output unit. 107.
  • a behavior history database 101a includes a behavior history database 101a, a time-series data acquisition unit 101, a generalization processing unit 102, a data processing unit 103, a learning unit 104, a learning model 104a, a BERT processing unit 105, a range
  • the action history database 101a is a part that stores action history data when the PC 200 accesses the WEB server 300.
  • PC 200 or WEB server 300 stores action history data in action history database 101a each time it is accessed or periodically.
  • the action history database 101a stores user actions other than web access according to operations by the operator.
  • a user receives a service equivalent to the service provided by the WEB server 300 by a method other than the WEB server 300, such as by telephone, a telephone operator or the like registers the behavior of the user.
  • the behavior of the user indicates the behavior of receiving the service when the user attempts to receive the service.
  • the time-series data acquisition unit 101 is a part that acquires time-series data, which is action history data, from the action history database 101a.
  • the generalization processing unit 102 is a part that performs generalization processing on time-series data with a low occurrence frequency among the time-series data. For example, as generalization processing, the generalization processing unit 102 replaces all or part of time-series data with a low occurrence frequency with a predetermined symbol or character string.
  • FIG. 3 is a schematic diagram showing a specific example of generalization processing.
  • action identifiers indicated by action A1, action A2, . . . are shown as access information for the WEB site.
  • a certain user performed action A1, action A2, . . . action B3, action B4, and action B5.
  • This action A1 or the like indicates an action identifier and indicates that one piece of information in the WEB server 300 has been accessed.
  • Action A1 and action B1 indicate different action categories.
  • the generalization processing unit 102 replaces the low-frequency action with the action category+[UNK]. For example, the generalization processing unit 102 replaces the action B4 with B[UNK] when the occurrence frequency of the action B4 is low (FIG. 3(b)). More detailed processing contents of the generalization processing unit 102 will be described later.
  • the data processing unit 103 is a part that inserts an action identifier for distinguishing each piece of time-series data when there is a gap of a predetermined time or more between the time-series data that indicates a plurality of user actions. .
  • FIG. 4 is a schematic diagram showing the action identifier insertion process. In this figure, notation of categories is omitted. As shown in FIG. 4( a ), it is assumed that there is 6 minutes between action 1 and action 2 and 26 minutes between action 2 and action 3 . Other actions are assumed to be as shown in the figure. In many cases, such user actions are temporally continuous and do not have clear boundaries. Also, the time intervals between user actions are often varied.
  • the data processing unit 103 may insert an action identifier according to the length of the user's action instead of or in addition to inserting the action identifier indicating the break. For example, the data processing unit 103 may add an action identifier corresponding to each length of time at home, time away from home, or time spent traveling when there is a user action of staying at home, going out, or moving. For example, one action identifier indicating being at home for one hour and two action identifiers for two hours may be added. Also, an action identifier indicating time may be added either before or after it.
  • the learning unit 104 is a part that performs machine learning using time-series data that has undergone generalization processing and data processing.
  • machine learning is performed using BERT (Bidirectional Encoder Representations from Transformers), which is used as a language model for natural language processing.
  • BERT Bidirectional Encoder Representations from Transformers
  • learning processing is performed by performing pre-learning and fine-tuning.
  • pre-learning fill-in-the-blank problem processing and neighbor prediction processing are performed using time-series data.
  • the BERT learning model 104a is generated by inputting generalized and data-processed time-series data. .
  • FIG. 5 is a diagram showing a model that schematically shows BERT.
  • the BERT processing unit 105 is a part that performs processing using the learning model 104a by BERT.
  • the BERT processing unit 105 uses the self-attention function of the BERT learning model 104a to calculate attention weights that indicate the degree of mutual relevance of a plurality of pieces of input time-series data.
  • the learning unit 104 learns the learning model 104a to calculate the attention weight.
  • the range selection unit 106 is a part that derives an action related to the specified user's action based on the weight of attention calculated by the BERT processing unit 105 .
  • the range selection unit 106 receives time-series data to be compared, compares the weight of attention between the time-series data to be compared, and a threshold input in advance, and selects attentions equal to or greater than the threshold. Select time series data with weights of . Note that the range selection unit 106 may select time-series data after the oldest time-series data. In this case, time-series data with an attention weight less than the threshold may be included.
  • the output unit 107 is a part that outputs the selected time-series data.
  • the output unit 107 includes outputting to the display unit or outputting to the outside via the communication unit.
  • FIG. 6 is a flowchart showing learning processing of the behavior analysis device 100. As shown in FIG.
  • the time-series data acquisition unit 101 receives action history data of multiple users and threshold parameters for time intervals (S101). Then, the time-series data acquisition unit 101 acquires the action date and time, the user identifier, and the action identifier from the action history data (S102).
  • the generalization processing unit 102 sorts the action identifiers acquired for each user based on the user identifiers, and performs generalization processing on action identifiers with low frequency of occurrence among the action identifiers for each user. That is, the low-frequency action identifier is replaced with a generalized symbol (S103).
  • the data processing unit 103 inserts an action identifier indicating a break between action identifiers based on the threshold parameter (S104). These processes are performed on, for example, 1000 pieces of time-series data.
  • the learning unit 104 performs learning processing using BERT, generates and stores a learning model 104a based on BERT (S105, S106). For example, learning processing is performed using 1000 pieces of time-series data.
  • FIG. 7 is a flowchart showing the processing contents of the behavior analysis device 100. As shown in FIG.
  • the processes S201 to S204 are generally the same as the processes S101 to S104. That is, in the behavior analysis device 100, the time-series data acquisition unit 101 acquires the user's behavior history data and the threshold parameter. Note that the time-series data acquisition unit 101 further acquires the threshold for the attention weight and the action target information of the user to be compared. Then, the time-series data acquisition unit 101 acquires action identifiers and the like from the action history data as time-series data, the generalization processing unit 102 performs generalization processing, and the data processing unit 103 applies predetermined conditions for the time-series data. Insert an action identifier that indicates a break in the filled place.
  • the BERT processing unit 105 inputs the time-series data including the action identifier and the delimiter identifier to the learning model 104a, and acquires the attention weight for each time-series data (S205).
  • the range selection unit 106 selects the user's time-series data specified in advance from all the time-series data based on the weight of attention for each combination of time-series data and the threshold for the weight of attention accepted in advance. is selected (S206). That is, the range selection unit 106 selects the time-series data ( action history data).
  • the output unit 107 outputs the selected time-series data (action history data) and attention weight (S207).
  • FIG. 8 is a diagram showing the action history database 101a.
  • the action history database 101a associates user IDs, dates and times, and categories 1 to 4 with each other.
  • a user ID is an identifier for identifying a user.
  • the date and time indicates the date and time when the user acted. Although the drawing shows the date and time, it may be possible to indicate only the date.
  • Classification 1 to Classification 4 indicate classification categories of user behavior. Classification 1 indicates WEB access or a call to a call center.
  • Classification 2 indicates a classification such as a corporate site, an OLT (online procedure), or a comprehensive IC (Information Center).
  • Classification 3 indicates a classification of web browsing or incoming call (telephone).
  • Classification 4 indicates the classification of specific examples of user behavior. The figure shows access to MyPage, access to a point page, and the like.
  • FIG. 9 is a diagram showing the frequency of occurrence for each category for the action history data of all users in a predetermined period. For example, the figure shows that the frequency of actions for category 1: WEB, category 2: corporate site, category 3: viewing, and category 4: My_Page is 20. This frequency is information aggregated from the action history of each user described in the action history database 101a.
  • the generalization processing unit 102 performs aggregation processing of frequencies for each classification when performing generalization processing on time-series data.
  • FIG. 10 is a diagram in which the frequencies of user behavior classifications are aggregated for each classification configured for each hierarchy. In other words, the frequency of each user behavior is tallied for each large classification, each middle classification, and each small classification.
  • the classifications are divided into Classes 1-4. Classification 1 indicates the classification of the highest concept of user behavior. Classes 2 to 4 are defined such that the concept becomes narrower as the numerical value increases.
  • FIG. 10(a) is a diagram summarizing the frequency of user actions included in category 1.
  • Category 1 is a category including categories 2 to 4. As shown in the figure, the frequency of user behavior classified into whether the user used the WEB or used the call center is tallied.
  • FIG. 10(b) is a diagram summarizing the frequency of user actions included in category 2.
  • Category 2 is a category that includes Category 3 and Category 4. For example, it indicates that the frequency of accessing the corporate site, the frequency of accessing the OLT, and the like are aggregated.
  • FIG. 10(c) is a diagram summarizing the frequency of user actions included in category 3.
  • FIG. 11 is a diagram in which the summary tables shown in FIGS. 9 and 10(a) to 10(c) are merged.
  • the classifications are sorted in descending order of frequency after merging.
  • classifications composed of large classifications are ranked higher.
  • items in the middle category and minor category are missing.
  • a character string [UNK] indicating general information is described in this missing portion.
  • a character string other than [UNK] may be used.
  • Other symbols may also be used, such as character strings or symbols indicating general information.
  • FIG. 12 is a diagram of the 12 categories with the highest frequency of occurrence extracted from the merged summary table shown in FIG. In the present disclosure, this is called a management table. Of course, the number of cases is not limited to 12, and any value may be used.
  • FIG. 13 is a generalized diagram of action identifiers based on the management table (FIG. 12).
  • the generalization processing unit 102 searches the action history database 101a for an action history record that matches each classification described in the management table. Then, each classification in the matching action history record is connected with "/" to generate an action identifier.
  • the generalization processing unit 102 replaces the unmatched lower classification with [UNK] for the action history records that match the upper classification but do not match the lower classification. Then, each classification is connected with "/" to generate an action identifier.
  • categories 1 to 3 are action history databases. 101a, regardless of the contents of Category 4, Category 4: [UNK] is used to generate an action identifier.
  • WEB/OLT/Browse/[UNK] is generated as the action identifier of the action history record R2 (see record R21).
  • "price plan option" is registered as category 4, but since the frequency of access to this item is low, generalization processing is performed.
  • WEB/OLT/browsing/[UNK] corresponds to the action category.
  • FIG. 14 shows a diagram in which action identifiers indicating delimiters are inserted into the generalized action history data based on the time interval between the actions.
  • records R41 to R43 are inserted between user actions. These records R41 to R43 indicate action identifiers indicating the delimiters shown in FIG. In FIG. 14, a break is indicated by inserting "SEP". Therefore, it becomes easy to grasp the adjacency relation in the behavior of the user. That is, when the time interval is small, it is considered that there is a close relationship between adjacent behaviors. On the other hand, if the time interval is large, there may not be much relevance between the adjacent actions. The present disclosure makes clear the relevance of those adjacent behaviors.
  • the insertion of action identifiers indicating delimiters shown in FIG. 14 is performed on the action history data acquired by the time-series data acquisition unit 101, and the learning unit 104 performs learning processing by BERT.
  • the time-series data acquisition unit 101 acquires, for example, 1000 pieces of action history data as time-series data from all action history data. Then, the generalization processing unit 102 and the data processing unit 103 perform the above-described generalization processing and insertion processing of action identifiers indicating breaks on the 1000 pieces of time-series data.
  • the learning unit 104 performs fill-in-the-blank problem processing and adjacency prediction processing on the processed time-series data.
  • the fill-in-the-blank problem is performed by randomly masking one or more time-series data records.
  • the adjacency prediction process performs adjacency prediction between records.
  • the learning model 104a is learned.
  • FIG. 15 is a diagram schematically showing the attention weight calculation and selection process from the user's action history database 101a.
  • FIG. 15A for convenience, the date and time when the action occurred and the action identifier are shown.
  • records to be action segment targets (action target information) are specified in advance by the operator.
  • FIG. 15(b) is a diagram in which self-attention weights calculated based on the self-attention mechanism by the BERT processing unit 105 are associated.
  • the action identifier WEB/corporate site/browsing/customer support is designated as the action segment target.
  • the degree of relevance to this is represented by the weight of self-attention.
  • FIG. 15(c) is a diagram showing the range selected by the range selection unit 106 when the threshold value of the self-attention weight is 0.3.
  • Action identifiers having a self-attention weight of 0.3 or more are selected.
  • an action identifier having a weight of self-attention of 0.3 or more is selected. You may select the action identifier that occurs after the action identifier that was created.
  • the behavior analysis device 100 functions as an information processing device for generalizing time-series data.
  • the behavior analysis device 100 of the present disclosure includes a time-series data acquisition unit 101 that acquires unimportant behavior data from among one or more pieces of behavior data indicating user behavior, and a generalization processing unit that generalizes the unimportant behavior data. 102;
  • unimportant action data indicates actions with low frequency among the user's action history.
  • the generalization processing unit 102 replaces the non-important action data with a predetermined character string (for example, [UNK]) as generalization processing.
  • the generalization processing unit 102 performs generalization processing on the non-important behavior data so as to indicate the behavior category.
  • WEB/OLT/view/[UNK] when there is an action identifier WEB/OLT/view/[UNK], WEB/OLT/view/ indicates the action category.
  • the non-important behavior data may be based not only on the frequency of occurrence but also on other circumstances. For example, a method may be added in advance to data that is deemed unnecessary for learning as non-important behavior data. Also, data after a predetermined period of time may be treated as non-important action data.
  • the behavior analysis device 100 further includes a behavior history database 101a (history storage unit) that stores a history of user behavior data.
  • the time-series data acquisition unit 101 then refers to the action history database 101a to acquire non-important action data.
  • the BERT processing unit 105 functioning as a machine learning unit calculates the weight of attention between time-series data based on the self-attention function, and determines the relevance of arbitrary time-series data based on the weight of attention. Obtain one or more other high time series data.
  • time-series data can be calculated using the self-attention function of the learning model obtained by performing learning processing in a data format suitable for time-series data.
  • the BERT processing unit 105 acquires time-series data generated after another time-series data that satisfies a predetermined condition among other time-series data with an attention weight equal to or greater than a predetermined value.
  • time-series data after the occurrence of highly relevant time-series data will be treated as related.
  • This may include time-series data that is not highly relevant, but since it is time-series data surrounded by time-series data that is highly relevant, it is not completely unrelated.
  • time series data can also be included.
  • each functional block may be implemented using one device physically or logically coupled, or directly or indirectly using two or more physically or logically separate devices (e.g. , wired, wireless, etc.) and may be implemented using these multiple devices.
  • a functional block may be implemented by combining software in the one device or the plurality of devices.
  • Functions include judging, determining, determining, calculating, calculating, processing, deriving, investigating, searching, checking, receiving, transmitting, outputting, accessing, resolving, selecting, choosing, establishing, comparing, assuming, expecting, assuming, Broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, assigning, etc. can't
  • a functional block (component) that performs transmission is called a transmitting unit or transmitter.
  • the implementation method is not particularly limited.
  • the behavior analysis device 100 may function as a computer that performs processing of the behavior analysis method of the present disclosure.
  • FIG. 16 is a diagram illustrating an example of a hardware configuration of behavior analysis device 100 according to an embodiment of the present disclosure.
  • the behavior analysis device 100 described above may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the hardware configuration of behavior analysis device 100 may be configured to include one or more of each device shown in the figure, or may be configured without including some devices.
  • Each function in the behavior analysis device 100 is performed by the processor 1001 performing calculations by loading predetermined software (programs) onto hardware such as the processor 1001 and the memory 1002, controlling communication by the communication device 1004, controlling the memory It is realized by controlling at least one of data reading and writing in 1002 and storage 1003 .
  • the processor 1001 for example, operates an operating system and controls the entire computer.
  • the processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic device, registers, and the like.
  • CPU central processing unit
  • the generalization processing unit 102 and the data processing unit 103 described above may be implemented by the processor 1001 .
  • the processor 1001 also reads programs (program codes), software modules, data, etc. from at least one of the storage 1003 and the communication device 1004 to the memory 1002, and executes various processes according to them.
  • programs program codes
  • software modules software modules
  • data etc.
  • the generalization processing unit 102 may be implemented by a control program stored in the memory 1002 and running on the processor 1001, and other functional blocks may be implemented in the same way.
  • FIG. Processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via an electric communication line.
  • the memory 1002 is a computer-readable recording medium, and is composed of at least one of, for example, ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), RAM (Random Access Memory), etc. may be
  • ROM Read Only Memory
  • EPROM Erasable Programmable ROM
  • EEPROM Electrical Erasable Programmable ROM
  • RAM Random Access Memory
  • the memory 1002 may also be called a register, cache, main memory (main storage device), or the like.
  • the memory 1002 can store executable programs (program code), software modules, etc. for implementing a behavior analysis method according to an embodiment of the present disclosure.
  • the storage 1003 is a computer-readable recording medium, for example, an optical disc such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disc, a magneto-optical disc (for example, a compact disc, a digital versatile disc, a Blu-ray disk), smart card, flash memory (eg, card, stick, key drive), floppy disk, magnetic strip, and/or the like.
  • Storage 1003 may also be called an auxiliary storage device.
  • the storage medium described above may be, for example, a database, server, or other suitable medium including at least one of memory 1002 and storage 1003 .
  • the communication device 1004 is hardware (transmitting/receiving device) for communicating between computers via at least one of a wired network and a wireless network, and is also called a network device, a network controller, a network card, a communication module, or the like.
  • the communication device 1004 includes a high-frequency switch, a duplexer, a filter, a frequency synthesizer, etc., in order to realize at least one of, for example, frequency division duplex (FDD) and time division duplex (TDD). may consist of
  • FDD frequency division duplex
  • TDD time division duplex
  • the output unit 107 described above may be implemented by the communication device 1004 .
  • the input device 1005 is an input device (for example, keyboard, mouse, microphone, switch, button, sensor, etc.) that receives input from the outside.
  • the output device 1006 is an output device (eg, display, speaker, LED lamp, etc.) that outputs to the outside. Note that the input device 1005 and the output device 1006 may be integrated (for example, a touch panel).
  • Each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured using a single bus, or may be configured using different buses between devices.
  • the behavior analysis device 100 includes hardware such as a microprocessor, a digital signal processor (DSP), an ASIC (Application Specific Integrated Circuit), a PLD (Programmable Logic Device), and an FPGA (Field Programmable Gate Array). , and part or all of each functional block may be implemented by the hardware.
  • processor 1001 may be implemented using at least one of these pieces of hardware.
  • notification of information is not limited to the aspects/embodiments described in the present disclosure, and may be performed using other methods.
  • notification of information includes physical layer signaling (e.g. DCI (Downlink Control Information), UCI (Uplink Control Information)), upper layer signaling (e.g. RRC (Radio Resource Control) signaling, MAC (Medium Access Control) signaling, It may be implemented by broadcast information (MIB (Master Information Block), SIB (System Information Block))), other signals, or a combination thereof.
  • RRC signaling may also be called an RRC message, and may be, for example, an RRC connection setup message, an RRC connection reconfiguration message, or the like.
  • Input/output information may be stored in a specific location (for example, memory) or managed using a management table. Input/output information and the like may be overwritten, updated, or appended. The output information and the like may be deleted. The entered information and the like may be transmitted to another device.
  • the determination may be made by a value represented by one bit (0 or 1), by a true/false value (Boolean: true or false), or by numerical comparison (for example, a predetermined value).
  • notification of predetermined information is not limited to being performed explicitly, but may be performed implicitly (for example, not notifying the predetermined information). good too.
  • Software whether referred to as software, firmware, middleware, microcode, hardware description language or otherwise, includes instructions, instruction sets, code, code segments, program code, programs, subprograms, and software modules. , applications, software applications, software packages, routines, subroutines, objects, executables, threads of execution, procedures, functions, and the like.
  • software, instructions, information, etc. may be transmitted and received via a transmission medium.
  • a transmission medium For example, if the Software uses wired technology (coaxial cable, fiber optic cable, twisted pair, Digital Subscriber Line (DSL), etc.) and/or wireless technology (infrared, microwave, etc.), the website, Wired and/or wireless technologies are included within the definition of transmission media when sent from a server or other remote source.
  • wired technology coaxial cable, fiber optic cable, twisted pair, Digital Subscriber Line (DSL), etc.
  • wireless technology infrared, microwave, etc.
  • data, instructions, commands, information, signals, bits, symbols, chips, etc. may refer to voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, light fields or photons, or any of these. may be represented by a combination of
  • information, parameters, etc. described in the present disclosure may be expressed using absolute values, may be expressed using relative values from a predetermined value, or may be expressed using other corresponding information.
  • radio resources may be indexed.
  • determining and “determining” used in this disclosure may encompass a wide variety of actions.
  • “Judgement” and “determination” are, for example, judging, calculating, computing, processing, deriving, investigating, looking up, searching, inquiring (eg, lookup in a table, database, or other data structure);
  • "judgment” and “determination” are used for receiving (e.g., receiving information), transmitting (e.g., transmitting information), input, output, access (accessing) (for example, accessing data in memory) may include deeming that a "judgment” or “decision” has been made.
  • judgment and “decision” are considered to be “judgment” and “decision” by resolving, selecting, choosing, establishing, comparing, etc. can contain.
  • judgment and “decision” can include considering that some action is “judgment” and “decision”.
  • judgment (decision) may be read as “assuming”, “expecting”, “considering”, or the like.
  • connection means any direct or indirect connection or coupling between two or more elements, It can include the presence of one or more intermediate elements between two elements being “connected” or “coupled.” Couplings or connections between elements may be physical, logical, or a combination thereof. For example, “connection” may be read as "access”.
  • two elements are defined using at least one of one or more wires, cables, and printed electrical connections and, as some non-limiting and non-exhaustive examples, in the radio frequency domain. , electromagnetic energy having wavelengths in the microwave and light (both visible and invisible) regions, and the like.
  • a and B are different may mean “A and B are different from each other.”
  • the term may also mean that "A and B are different from C”.
  • Terms such as “separate,” “coupled,” etc. may also be interpreted in the same manner as “different.”
  • DESCRIPTION OF SYMBOLS 100... Action analysis apparatus, 200... PC, 300... WEB server, 101a... Action history database, 101... Time series data acquisition part, 102... Generalization process part, 103... Data processing part, 104... Learning part, 104a... Machine learning model, 105... BERT processing unit, 106... range selection unit, 107... output unit.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本発明は、ユーザ行動などの時系列データを、機械学習処理において扱うにあたって、その負荷を軽減することができる時系列データ処理装置を提供することを目的とする。 行動分析装置100は、ユーザ行動を示す一または複数の時系列データのうち、非重要行動データを取得する時系列データ取得部101と、非重要行動データを一般化処理する一般化処理部102と、を備える。本開示において、非重要行動データは、ユーザの行動履歴のうち、その頻度が低い行動を示す。そして、一般化処理部102は、一般化処理として、非重要行動データを所定の文字列(例えば[UNK])に置き換える。また、一般化処理部102は、非重要行動データを、当該行動カテゴリを示すよう一般化処理を行う。

Description

情報処理装置
 本発明は、ユーザの行動などを示す時系列データを処理する情報処理装置に関する。
 非特許文献1に記載されている自然言語処理を行うBERT(Bidirectional Encoder Representations from Transformers)による機械学習方法が知られている。このBERTは、自己注意(Self-Attention)機構付きのエンコーダデコーダモデルを有しており、自然言語処理および画像処理を行う。
Jacob Devlin、他2名、BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding、[online]、掲載日:2019年5月24日、掲載者:arXiv.org、検索日:2021年7月2日、https://arxiv.org/pdf/1810.04805.pdf、英語
 顧客体験またはユーザ行動のそれぞれにおける時間経過が、その顧客体験またはユーザ行動を把握する上で重要である。そして、局所的または大局的な時系列データの隣接関係の学習をBERTにおいて適切に行う必要がある。一方で、顧客体験またはユーザ行動のそれぞれにおける時間経過が、その顧客体験またはユーザ行動を把握する上で重要であるが、異なるタイミングで発生したユーザ行動を区別して学習すると、その学習量が膨大となる。
 そこで、上述の課題を解決するために、本発明は、ユーザ行動などの行動データを、機械学習処理において扱うにあたって、その負荷を軽減することができる情報処理装置を提供することを目的とする。
 本発明の情報処理装置は、ユーザ行動を示す一または複数の行動データのうち、非重要行動データを取得する取得部と、前記非重要行動データを一般化処理する処理部と、を備える。
 本発明によると、機械学習の処理を行う際においてその負荷を軽減したデータを生成することができる。
本開示におけるユーザ行動を取得して分析する行動分析装置100を含む通信システムのシステム構成図である。 行動分析装置100の機能構成を示すブロック図である。 一般化処理の具体例を示す模式図である。 行動識別子の挿入処理を示す模式図である。 BERTを模式的に示したモデルを示す図である。 行動分析装置100の学習処理を示すフローチャートである。 、行動分析装置100の処理内容を示すフローチャートである。 行動履歴データベース101aを示す図である。 全ユーザに対して、分類ごとの発生頻度を集計した図である。 ユーザ行動の分類の頻度を、階層ごとに構成された分類ごとに集計した図である。 図9および図10(a)~図10(c)で示される集計表をマージした図である。 マージされた集計表から、発生頻度が上位12件の分類を取り出した図である。 管理テーブル(図12)に基づいて、行動識別子を一般化した図である。 一般化処理された行動履歴データに対して、その行動の間の時間間隔に基づいて区切りを示す行動識別子を挿入した図である。 ユーザの行動履歴データベース101aからアテンションの重みの算出および選択処理を模式的に示した図である。 、本開示の一実施の形態に係る行動分析装置100のハードウェア構成の一例を示す図である。
 添付図面を参照しながら本開示の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
 図1は、本開示におけるユーザ行動を取得して分析する行動分析装置100を含む通信システムのシステム構成図である。この行動分析装置100は、ユーザがWEBサイトにアクセスした操作履歴を時系列データとして扱う時系列データ処理装置として機能する。また、行動分析装置100は、ユーザがある企業の電話サービス(製品の相談または質問等)を利用した場合に、その利用の状態を時系列データとして扱う。
 行動分析装置100は、分析対象であるユーザが操作するPC200がWEBサーバ300に対するアクセス履歴を収集して分析する。また、電話サービスを利用したユーザの行動履歴については、そのサービス運営者がその行動履歴を記録しておき、行動分析装置100の行動履歴データベース101aに登録する。
 PC200は、一般的なパーソナルコンピュータであって、WEBサーバ300にネットワークを介してアクセスする。
 WEBサーバ300は、PC200に対してWEB情報の提供を行うサーバである。
 行動分析装置100は、WEBサーバ300におけるどの情報に対してPC200がアクセスしたか、その行動履歴データを収集する。例えば、PC200が携帯電話の通信会社のサイトにアクセスした場合、どのような情報にアクセスしたか、収集する。より具体的には、携帯電話の料金プランの情報、携帯端末の種類の情報を収集する。
 図2は、行動分析装置100の機能構成を示すブロック図である。この行動分析装置100は、行動履歴データベース101a、時系列データ取得部101、一般化処理部102、データ加工部103、学習部104、学習モデル104a、BERT処理部105、範囲選択部106および出力部107を含んで構成されている。以下各構成について説明する。
 行動履歴データベース101aは、PC200がWEBサーバ300にアクセスした行動履歴データを記憶する部分である。PC200またはWEBサーバ300は、アクセスする度にまたは定期的に行動履歴データを行動履歴データベース101aに記憶する。また、行動履歴データベース101aは、上述したとおり、WEBアクセス以外のユーザの行動をオペレータによる操作に従って記憶する。本開示においては、WEBサーバ300以外の方法、例えば電話などにより、WEBサーバ300が提供するサービスと同等のサービスをユーザが受けた場合に、そのユーザの行動を電話オペレータ等が登録する。本開示においては、ユーザの行動とは、ユーザがあるサービスを受けようとした場合に、そのサービスを受けることに対する行動を示している。
 時系列データ取得部101は、行動履歴データベース101aから行動履歴データである時系列データを取得する部分である。
 一般化処理部102は、時系列データのうち、発生頻度の低い時系列データを一般化処理する部分である。例えば、一般化処理部102は、一般化処理として、発生頻度の低い時系列データの全部または一部を、所定の記号または文字列に置き換える。
 図3は、一般化処理の具体例を示す模式図である。図では、行動A1、行動A2・・・で示した行動識別子を、WEBサイトに対するアクセス情報として示している。図3(a)では、あるユーザは、行動A1、行動A2・・・行動B3、行動B4、行動B5を行った。この行動A1等は、行動識別子を示し、WEBサーバ300における一の情報に対してアクセスしたことを示す。また、行動A1と、行動B1とは、異なる行動カテゴリを示す。そして、一般化処理部102は、低頻度の行動を、行動カテゴリ+[UNK]に置き換える。例えば、一般化処理部102は、行動B4の発生頻度が低い場合に、行動B4をB[UNK]に置き換える(図3(b))。一般化処理部102の更なる詳細な処理内容については、後述する。
 データ加工部103は、複数あるユーザ行動を示す時系列データに対して、時系列データ間が所定時間以上あいている場合に、各時系列データを区別するための行動識別子を挿入する部分である。
 図4は、行動識別子の挿入処理を示す模式図である。なお、本図においては、カテゴリの表記を省略している。図4(a)に示される通り、行動1と行動2との間は6分であり、行動2と行動3との間は26分であるとする。他の行動についても、図に示された通りであるとする。このようなユーザの行動において、時間的に連続していて明確な区切りがない場合が多い。また、ユーザの行動間の時間間隔もまちまちである場合が多い。
 図4(b)に示される通り、データ加工部103は、行動間の間隔を閾値パラメータで対数をとった実数以下の最大の整数の数だけ区切りを表す行動識別子を挿入する。例えば、図4に示されるように、行動1と行動2との間は6分である。データ加工部103は、閾値パラメータを5とした場合、Log5(6)=1を計算して、間隔が6分である行動1と行動2と間に、1つの区切りを表す行動識別子を挿入する。他の行動においても同様の計算を行う。
 このように区切りを示す行動識別子を挿入することで、行動の区切りを示すことができる。また、いわゆるログスケールを取って、区切りを示す行動識別子の個数を時間間隔が長いほど多く挿入するとともに、ある程度時間間隔が長くなった場合には、その個数を制限する方向に調整する関数を使う。これにより、時間間隔の長さと、区切りの行動識別子との個数との関係を示すことができる。ユーザの行動によっては、ある程度長く経過した場合には、その行動の意味に変化がない場合が多い。例えば、5分後に行ったユーザの行動と、1年後に行ったユーザの行動と、では、明確に区別する必要があるが、1年後に行ったユーザの行動と、2年後に行ったユーザの行動とは、その行動の意味または行動の内容に区別する必要がない場合がある。
 なお、データ加工部103は、区切りを示す行動識別子を挿入することに代えて、またはそれに加えて、ユーザの行動の長さに応じて行動識別子を挿入してもよい。例えば、データ加工部103は、ユーザ行動として在宅、外出、または移動があった場合に、在宅時間、外出時間、または移動時間のそれぞれの長さに応じた行動識別子を追加してもよい。例えば在宅を示す行動識別子を1時間であれば、1つ、2時間であれば2つとするように、その行動識別子を追加してもよい。また、時間を示す行動識別子をその前後のどちらかに追加してもよい。
 学習部104は、一般化処理して、データ加工された時系列データを用いて機械学習を行う部分である。本開示においては、自然言語処理の言語モデルに利用されているBERT(Bidirectional Encoder Representations from Transformers)を用いた機械学習を行う。BERTでは、事前学習とファインチューニングとを行うことで学習処理を行う。事前学習では、時系列データを用いて、穴埋め問題処理と隣接予測処理とを行う。通常のBERTによる学習では、文章を入力しているが、本開示においては、上記の通り、一般化処理され、データ加工された時系列データを入力することにより、BERTによる学習モデル104aを生成する。
 図5は、BERTを模式的に示したモデルを示す図である。このモデルは、ベクトルのシーケンス(E1… EN)を入力とし、ベクトルのシーケンス(T1…TN)が出力されるモデルである。また、入力層と出力層との間に隠れ層(Trm=Transformer)を複数重ねた構造である。この図は、非特許文献1から抜粋した図である。
 BERT処理部105は、BERTによる学習モデル104aを用いた処理を行う部分である。BERT処理部105は、BERTの学習モデル104aにおけるSelf Attention(自己注意)機能を用いて、入力した複数の時系列データの相互に関連する度合いを示すアテンションの重みを算出する。上記学習部104は、このアテンションの重みを算出するために学習モデル104aを学習する。
 範囲選択部106は、BERT処理部105が算出したアテンションの重みに基づいて、指定されたユーザの行動に関連する行動を導出する部分である。範囲選択部106は、比較対象となる時系列データを受け付けており、当該比較対象の時系列データとの間のアテンションの重みと、事前に入力された閾値とを比較して、閾値以上のアテンションの重みを有する時系列データを選択する。なお、範囲選択部106は、最も古い時系列データ以降の時系列データを選択してもよい。この場合、アテンションの重みが閾値未満の時系列データを含む場合がある。
 出力部107は、選択された時系列データを出力する部分である。本開示において、出力部107は、表示部に出力する、または通信部を介して外部に出力することを含む。
 つぎに、本開示の行動分析装置100の動作について説明する。図6は、行動分析装置100の学習処理を示すフローチャートである。
 時系列データ取得部101は、複数のユーザの行動履歴データと、時間間隔の閾値パラメータとを受け付ける(S101)。そして、時系列データ取得部101は、行動履歴データから、行動した日時、ユーザ識別子および行動識別子を取得する(S102)。
 一般化処理部102は、ユーザ識別子に基づいてユーザごとに取得された行動識別子をソートして、ユーザごとの行動識別子において発生頻度が低頻度の行動識別子に対して、一般化処理を行う。すなわち、低頻度の行動識別子を一般化した記号に置換する(S103)。
 データ加工部103は、閾値パラメータに基づいて、行動識別子間に、区切りを示す行動識別子を挿入する(S104)。これら処理は、例えば、1000個の時系列データに対して行われる。
 学習部104は、BERTを用いた学習処理を行い、BERTによる学習モデル104aを生成し、記憶する(S105、S106)。例えば、1000個の時系列データを用いた学習処理が行われる。
 つぎに、学習した学習モデル104aを用いた処理について説明する。ここでは、学習モデル104aのSelf Attention機能を用いて、指定したユーザの行動に対して関連する他の行動を特定する処理を示す。図7は、行動分析装置100の処理内容を示すフローチャートである。
 処理S201~S204は、処理S101~S104と概ね同じである。すなわち、行動分析装置100において、時系列データ取得部101は、ユーザの行動履歴データおよび閾値パラメータを取得する。なお、時系列データ取得部101は、アテンションの重みに対する閾値および比較対象となるユーザの行動対象情報をさらに取得する。そして、時系列データ取得部101は、行動履歴データから行動識別子等を時系列データとして取得し、一般化処理部102は、一般化処理し、データ加工部103は、時系列データの所定条件を満たした箇所に、区切りを示す行動識別子を挿入する。
 BERT処理部105は、学習モデル104aに、行動識別子および区切り識別子を含んだ時系列データを入力し、時系列データごとのアテンションの重みを取得する(S205)。
 範囲選択部106は、各時系列データの組み合わせごとのアテンションの重みと、事前に受け付けられたアテンションの重みに対する閾値とに基づいて、全時系列データから、事前に指定されたユーザの時系列データに対応する行動履歴データを選択する(S206)。すなわち、範囲選択部106は、処理S201で受け付けた比較対象となる行動対象情報(一時系列データ)と各時系列データとのアテンションの重みのうち、そのアテンションの重みが閾値以上の時系列データ(行動履歴データ)を選択する。
 出力部107は、選択された時系列データ(行動履歴データ)およびアテンションの重みを出力する(S207)。
 このようにして、行動対象情報に関連する他の行動履歴データを選択することができる。
 つぎに、一般化処理について図8から図11を用いて説明する。図8は、行動履歴データベース101aを示す図である。図に示される通り、行動履歴データベース101aは、ユーザID、日時、および分類1~分類4を対応付けている。ユーザIDは、ユーザを識別するための識別子である。日時は、ユーザが行動した日時を示す。図では、日にちおよび時刻を示しているが、日にちのみでもよい。分類1~分類4は、ユーザの行動の分類カテゴリを示す。分類1は、WEBアクセスか、コールセンタへの電話を示す。分類2は、コーポレートサイトであるか、OLT(オンライン手続き)、総合IC(Information Center)などの分類を示す。分類3は、WEB閲覧であるか、入電であるか(電話)の分類を示す。分類4は、ユーザ行動の具体例の分類を示す。図では、MyPageにアクセスした、ポイントのページにアクセスしたなどを示している。
 図9は、全ユーザの所定の期間における行動履歴データに対して、分類ごとの発生頻度を集計した図である。例えば、図は、分類1:WEB、分類2:コーポレートサイト、分類3:閲覧、分類4:My_Pageへの行動を起こした頻度は、20であることを示す。この頻度は、行動履歴データベース101aに記載されている各ユーザの行動履歴から集計される情報である。本開示においては、一般化処理部102が、時系列データに対して一般化処理を行う際に、分類ごとの頻度の集計処理を行う。
 図10は、ユーザ行動の分類の頻度を、階層ごとに構成された分類ごとに集計した図である。すなわち、大分類ごと、中分類ごと、小分類ごと、にそれぞれのユーザ行動の頻度を集計する。本開示においては、分類は、分類1~分類4に分けられている。分類1は、ユーザの行動の最上位概念の分類を示す。分類2~分類4は、その数値が大きくなるにしたがって、その概念が狭くなるよう定義されている。
 図10(a)は、分類1に含まれるユーザ行動の頻度を集計した図である。分類1は、分類2から分類4を含んだ分類である。図に示される通り、ユーザが、WEBを使ったか、コールセンタを使ったか、それぞれに分類されるユーザ行動の頻度を集計する。
 図10(b)は、分類2に含まれるユーザ行動の頻度を集計した図である。分類2は、分類3および分類4を含んで分類である。例えば、コーポレートサイトにアクセスした頻度、およびOLTにアクセスした頻度などを集計したことを示す。
 図10(c)は、分類3に含まれるユーザ行動の頻度を集計した図である。
 図11は、図9および図10(a)~図10(c)で示される集計表をマージした図である。図11では、分類は、マージしたのち、頻度の多い順に並び変えられている。なお、本開示においては、同一頻度の分類については、大分類で構成される分類を上位にしている。また、大分類で集計した頻度においては、中分類および小分類の項目が欠損している。この欠損部分には、一般的な情報であることを示す[UNK]という文字列を記述する。なお、[UNK]以外の文字列としてもよい。また、その他の記号としてもよく、一般的な情報であることを示すための文字列または記号とすればよい。
 図12は、図11に示されるマージされた集計表から、発生頻度が上位12件の分類を取り出した図である。本開示において、これを管理テーブルと称する。なお、当然ながら12件に限定するものではなく、任意の値としてもよい。
 図13は、管理テーブル(図12)に基づいて、行動識別子を一般化した図である。一般化処理部102は、管理テーブルに記述されている各分類に一致する行動履歴レコードを、行動履歴データベース101aから探索する。そして、一致する行動履歴レコードにおける各分類を“/”で連結して、行動識別子として生成する。一般化処理部102は、上位の分類が一致するものの、下位の分類が一致しない行動履歴レコードについては、一致しない下位の分類については、[UNK]に置き換える。そして、各分類を“/”で連結して、行動識別子として生成する。
 例えば、管理テーブルに記述されているレコードR1(分類1:WEB、分類2:コーポレートサイト、分類3:閲覧、分類4:My_Page)が、行動履歴データベース101aにも記述されていれば、それに基づいて行動識別子が生成される。
 一方、例えば、管理テーブルに記述されているレコードR2(分類1:WEB、分類2:OLT、分類3:閲覧、分類4:[UNK])のうち、分類1~分類3までが、行動履歴データベース101aにも記述されている場合、分類4の内容に関わらず、分類4:[UNK]を用いて、行動識別子が生成される。図13では、行動履歴レコードR2の行動識別子として、WEB/OLT/閲覧/[UNK]が生成される(レコードR21参照)。レコードR21においては、分類4として、「料金プラン オプション」が登録されているが、この項目へのアクセスの頻度が低いため、一般化処理される。なお、行動識別子WEB/OLT/閲覧/[UNK]のうち、WEB/OLT/閲覧が行動カテゴリに相当する。
 このように、全体の発生頻度に対して、各発生頻度が低い場合には、[UNK]という文字列を使って一般化処理する。図13においては、レコードR31(分類1:WEB、分類2:OLT、分類3:閲覧、分類4:ご契約内容の確認)の行動識別子は、WEB/OLT/閲覧/[UNK]となり、レコードR21の行動識別子と同じとなる。レコードR21とレコードR31とは、ユーザの全体の行動からすると同じ行動として扱われることになる。
 そして、BERT等のアテンション付きエンコーダモデルにおいて、その関連度を求める場合には、同じ行動として扱われることになる。よって、アテンションの重みを算出する際に、その算出処理を軽減することができる。
 図14は、一般化処理された行動履歴データに対して、その行動の間の時間間隔に基づいて区切りを示す行動識別子を挿入した図を示す。
 図に示されるとおり、レコードR41~R43が、ユーザの行動の間に挿入されている。これらレコードR41~R43は、図4で示した区切りを示す行動識別子を示す。図14では、“SEP”を挿入することで区切りを示している。よって、ユーザの行動における隣接関係を把握することを容易にする。すなわち、時間間隔が小さい場合には、隣接する行動間においては密接な関係があると考えられる。一方で、時間間隔が大きい場合には、その隣接する行動間においてそれほど関連性はないと考えられる。本開示では、それら隣接する行動の関連性を明確にしている。
 図14に示される区切りを示す行動識別子の挿入は、時系列データ取得部101により取得された行動履歴データに対して行われ、そして、学習部104によりBERTによる学習処理が行われる。
 時系列データ取得部101は、全行動履歴データから、例えば1000個の行動履歴データを時系列データとして取得する。そして、その1000個の時系列データに対して、一般化処理部102およびデータ加工部103は、上述した一般化処理および区切りを示す行動識別子の挿入処理を行う。
 学習部104は、それら処理がなされた時系列データに対して、穴埋め問題処理および隣接予測処理を行う。穴埋め問題は、一または複数の時系列データのレコードのうちランダムでマスクすることにより行う。隣接予測処理は、レコード同士の隣接予測を行う。このようにして、学習モデル104aが学習される。
 図15は、ユーザの行動履歴データベース101aからアテンションの重みの算出および選択処理を模式的に示した図である。図15(a)では、便宜上、その行動が発生した日時と行動識別子とを示す。図4に示されるように行動セグメント対象(行動対象情報)とするレコードが、オペレータによりあらかじめ指定される。
 図15(b)は、BERT処理部105によるセルフアテンション機構に基づいて算出されたセルフアテンションの重みを対応付けた図である。図では、行動識別子WEB/コーポレートサイト/閲覧/お客様サポートが行動セグメント対象として指定されている。そして、これとの関連度合いがセルフアテンションの重みで表される。
 図15(c)は、セルフアテンションの重みの閾値が0.3とした場合の範囲選択部106が選択した範囲を示す図である。セルフアテンションの重みが0.3以上のセルフアテンションの重みをもつ行動識別子が選択される。なお、本開示においては、0.3以上のセルフアテンションの重みをもつ行動識別子が選択されているが、これに限らず、0.3以上のセルフアテンションの重みをもつ行動識別子のうち最も古く発生した行動識別子以降に発生する行動識別子を選択してもよい。
 つぎに、本開示の行動分析装置100の作用効果について説明する。本開示において、行動分析装置100は、時系列データを一般化処理するための情報処理装置として機能する。
 本開示の行動分析装置100は、ユーザ行動を示す一または複数の行動データのうち、非重要行動データを取得する時系列データ取得部101と、非重要行動データを一般化処理する一般化処理部102と、を備える。
 本開示において、非重要行動データは、ユーザの行動履歴のうち、その頻度が低い行動を示す。そして、一般化処理部102は、一般化処理として、非重要行動データを所定の文字列(例えば[UNK])に置き換える。また、一般化処理部102は、非重要行動データを、行動カテゴリを示すよう一般化処理を行う。上述したとおり、行動識別子WEB/OLT/閲覧/[UNK]があった場合、WEB/OLT/閲覧/が行動カテゴリを示す。なお、非重要行動データは、発生頻度のみに基づくものではなく、そのほかの事情に基づいてもよい。例えば、あらかじめ学習には必要はないと思われるデータには、非重要行動データである旨の方法を付加しておいてもよい。また、所定時間経過したデータについても非重要行動データとして扱ってもよい。
 本開示において、行動分析装置100は、ユーザの行動データの履歴を記憶する行動履歴データベース101a(履歴記憶部)をさらに備える。そして、時系列データ取得部101は、行動履歴データベース101aを参照して、非重要行動データを取得する。
 機械学習部として機能するBERT処理部105は、時系列データ同士のアテンションの重みを、自己注意機能に基づいて算出し、当該アテンションの重みに基づいて、任意の時系列データに対して関連性の高い1または複数の他の時系列データを取得する。
 この構成により、時系列データに適したデータ形態で学習処理を行って得た学習モデルの自己注意機能を用いて関連性の高い時系列データを算出することができる。
 BERT処理部105は、アテンションの重みが所定値以上の他の時系列データのうち、所定条件を満たした一の他の時系列データ以降に発生した時系列データを取得する。
 この構成によれば、関連性の高い時系列データの発生以降の他の時系列データを関連したものとして扱うことになる。この中には、関連性の高くない時系列データも含む場合があるが、関連性の高い時系列データに囲まれた時系列データであることから、全く関連性がないわけでもない。このような時系列データをも含ませることができる。
 上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェアおよびソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的または論理的に結合した1つの装置を用いて実現されてもよいし、物理的または論理的に分離した2つ以上の装置を直接的または間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置または上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
 機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
 例えば、本開示の一実施の形態における行動分析装置100などは、本開示の行動分析方法の処理を行うコンピュータとして機能してもよい。図16は、本開示の一実施の形態に係る行動分析装置100のハードウェア構成の一例を示す図である。上述の行動分析装置100は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。行動分析装置100のハードウェア構成は、図に示した各装置を1つまたは複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 行動分析装置100における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002およびストレージ1003におけるデータの読み出しおよび書き込みの少なくとも一方を制御したりすることによって実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の一般化処理部102、データ加工部103などは、プロセッサ1001によって実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003および通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、一般化処理部102は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時または逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る行動分析方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002およびストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線ネットワークおよび無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)および時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の出力部107は、通信装置1004によって実現されてもよい。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005および出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
 また、行動分析装置100は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部または全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
 情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号またはこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
 本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨および範囲を逸脱することなく修正および変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)および無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、または他のリモートソースから送信される場合、これらの有線技術および無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
 本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、またはこれらの任意の組み合わせによって表されてもよい。
 なお、本開示において説明した用語および本開示の理解に必要な用語については、同一のまたは類似する意味を有する用語と置き換えてもよい。
 また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。
 本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
 「接続された(connected)」、「結合された(coupled)」という用語、またはこれらのあらゆる変形は、2またはそれ以上の要素間の直接的または間接的なあらゆる接続または結合を意味し、互いに「接続」または「結合」された2つの要素間に1またはそれ以上の中間要素が存在することを含むことができる。要素間の結合または接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1またはそれ以上の電線、ケーブルおよびプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域および光(可視および不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」または「結合」されると考えることができる。
 本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 本開示において、「含む(include)」、「含んでいる(including)」およびそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
 本開示において、例えば、英語でのa, anおよびtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
 本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
100…行動分析装置、200…PC、300…WEBサーバ、101a…行動履歴データベース、101…時系列データ取得部、102…一般化処理部、103…データ加工部、104…学習部、104a…機械学習モデル、、105…BERT処理部、106…範囲選択部、107…出力部。

Claims (8)

  1.  ユーザ行動を示す一または複数の時系列データのうち、非重要行動データを取得する取得部と、
     前記非重要行動データを一般化処理する処理部と、
    を備える、情報処理装置。
  2.  前記非重要行動データは、ユーザの行動履歴のうち、その頻度が低い行動を示す、
    請求項1に記載の情報処理装置。
  3.  前記処理部は、一般化処理として、前記非重要行動データを所定の文字列に置き換える、
    請求項1または2に記載の情報処理装置。
  4.  前記処理部は、前記非重要行動データを、行動カテゴリを示すよう一般化処理を行う、
    請求項1から3のいずれか一項に記載の情報処理装置。
  5.  ユーザの行動を示す前記時系列データの履歴を記憶する履歴記憶部をさらに備え、
     前記取得部は、前記履歴記憶部を参照して、非重要行動データを取得する、
    請求項2に記載の情報処理装置。
  6.  一般化処理された非重要行動データを含む時系列データを用いて機械学習に関する処理を行う機械学習処理部、
    をさらに備える情報処理装置。
  7.  前記機械学習処理部は、
     前記非重要行動データを含む時系列データ同士のアテンションの重みを、自己注意機能に基づいて算出し、
     当該アテンションの重みに基づいて、任意の時系列データに対して関連性の高い一または複数の他の時系列データを取得する、
    請求項6に記載の情報処理装置。
  8.  前記処理部は、
     前記アテンションの重みに基づいて関連性が高いと判断された前記他の時系列データのうち、所定の時間が経過した一の他の行動データを特定し、
     当該一の他の時系列データ以降に発生した一または複数の時系列データを取得する、
    請求項7に記載の情報処理装置。
     

     
PCT/JP2022/021018 2021-07-30 2022-05-20 情報処理装置 WO2023007922A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023538296A JPWO2023007922A1 (ja) 2021-07-30 2022-05-20

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021125361 2021-07-30
JP2021-125361 2021-07-30

Publications (1)

Publication Number Publication Date
WO2023007922A1 true WO2023007922A1 (ja) 2023-02-02

Family

ID=85086497

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/021018 WO2023007922A1 (ja) 2021-07-30 2022-05-20 情報処理装置

Country Status (2)

Country Link
JP (1) JPWO2023007922A1 (ja)
WO (1) WO2023007922A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033602A (ja) * 2019-08-23 2021-03-01 Kddi株式会社 情報処理装置、ベクトル生成方法及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021033602A (ja) * 2019-08-23 2021-03-01 Kddi株式会社 情報処理装置、ベクトル生成方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUGOMORI, YUSUKE: "Deep Learning: Detailed Commentary [2nd Edition]", 27 November 2019, MYNAVI PUIBLISHING CORPORATION, JP, ISBN: 978-4-8399-6951-6, article SUGOMORI, YUSUKE: "Passage; Deep Learning: Detailed Commentary", pages: 307 - 309, XP009543156 *

Also Published As

Publication number Publication date
JPWO2023007922A1 (ja) 2023-02-02

Similar Documents

Publication Publication Date Title
Abdelhamid Multi-label rules for phishing classification
Fu et al. Finding experts using social network analysis
US20110029509A1 (en) Best-Bet Recommendations
US9852208B2 (en) Discovering communities and expertise of users using semantic analysis of resource access logs
US20180060734A1 (en) Responding to user input based on confidence scores assigned to relationship entries in a knowledge graph
US11853340B2 (en) Clustering using natural language processing
US20210312919A1 (en) Conversation device
US11928137B2 (en) Management and optimization of search term clustering based on performance data
Chen et al. Do different cross‐project defect prediction methods identify the same defective modules?
Verma et al. Collaborative ranking-based text summarization using a metaheuristic approach
CN111444424A (zh) 一种信息推荐方法和信息推荐系统
JP7172187B2 (ja) 情報表示方法、情報表示プログラムおよび情報表示装置
WO2023007922A1 (ja) 情報処理装置
WO2023007921A1 (ja) 時系列データ処理装置
Shayegh et al. Automated approach to improve iot privacy policies
JP6944360B2 (ja) コンテンツの提示順位を制御する装置、方法、及び、プログラム
JP7054731B2 (ja) 対話システム
WO2019193796A1 (ja) 対話サーバ
JP2021124913A (ja) 検索装置
JP7320058B2 (ja) 対話システム
JP7323370B2 (ja) 審査装置
JP7216199B2 (ja) 対話システム
US11928158B2 (en) Identification of emerging clusters
US11914601B2 (en) Re-ranking device
JPWO2019187463A1 (ja) 対話サーバ

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22849001

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023538296

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE