WO2011074509A1 - 情報処理装置、情報処理方法および記録媒体 - Google Patents

情報処理装置、情報処理方法および記録媒体 Download PDF

Info

Publication number
WO2011074509A1
WO2011074509A1 PCT/JP2010/072311 JP2010072311W WO2011074509A1 WO 2011074509 A1 WO2011074509 A1 WO 2011074509A1 JP 2010072311 W JP2010072311 W JP 2010072311W WO 2011074509 A1 WO2011074509 A1 WO 2011074509A1
Authority
WO
WIPO (PCT)
Prior art keywords
variance
variable
information processing
explanatory variable
information
Prior art date
Application number
PCT/JP2010/072311
Other languages
English (en)
French (fr)
Inventor
健児 青木
貴之 中田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2011546098A priority Critical patent/JP5692091B2/ja
Priority to EP10837535.3A priority patent/EP2515260A4/en
Priority to US13/515,554 priority patent/US9104641B2/en
Priority to KR1020127015349A priority patent/KR101303417B1/ko
Priority to CN201080056544.XA priority patent/CN102656581B/zh
Publication of WO2011074509A1 publication Critical patent/WO2011074509A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S19/00Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
    • G01S19/38Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
    • G01S19/39Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
    • G01S19/396Determining accuracy or reliability of position or pseudorange measurements

Definitions

  • the present invention relates to an information processing apparatus, an information processing method, and a recording medium for estimating the mean and variance of an objective variable given an explanatory variable.
  • Non-Patent Document 1 assumes that the variance of the objective variable y is constant regardless of the value of the explanatory variable x, that is, the variance of the objective variable is uniform in the domain of the explanatory variable. .
  • the technique described in Non-Patent Document 1 assumes that the mean and variance of the objective variable are uniform in the domain of explanatory variables. Therefore, the technique described in Non-Patent Document 1 cannot estimate the mean and variance of the objective variable when the mean and variance of the objective variable depend on the explanatory variables. That is, the technique described in Non-Patent Document 1 has a problem that accurate regression analysis cannot be performed.
  • the technique described in Non-Patent Document 2 analyzes discrete time-series data observed at predetermined times. Therefore, the technique described in Non-Patent Document 2 cannot estimate the mean and variance of the objective variable when the mean and variance of the objective variable depend on explanatory variables that take continuous values. That is, the technique described in Non-Patent Document 2 has a problem that accurate regression analysis cannot be performed.
  • An object of the present invention is to provide an information processing apparatus, an information processing method, and a recording medium for solving the above-described problems.
  • the first information processing apparatus provides observation data including information indicating an explanatory variable and an objective variable whose value is observed with respect to the explanatory variable and whose mean and variance depend on the explanatory variable.
  • a parameter estimation unit that calculates an average and a variance of the objective variable for each region specified based on a division candidate that is information for dividing the domain of the explanatory variable into a plurality of regions; Calculating an information criterion for the division candidate based on the calculated mean and variance of the objective variable, and specifying an optimal division specifying unit for specifying one division candidate based on the calculated information criterion,
  • a smooth function indicating the mean of the objective variable in the domain of the explanatory variable based on the calculated mean and variance in each region identified based on the identified split candidate; and
  • a smoothing unit configured to calculate a smooth function indicating a distribution of the objective variables in the domain of the serial explanatory variables.
  • the first information processing method is an observation data including information indicating an explanatory variable and an objective variable whose values are observed with respect to the explanatory variable and whose mean and variance depend on the explanatory variable. And calculating the mean and variance of the objective variable for each area specified based on the division candidate, which is information for dividing the domain of the explanatory variable into a plurality of areas, and calculating the observation data and the calculated
  • the information criterion of the candidate for division is calculated based on the average and the variance of the objective variables, and one candidate for division is specified based on the calculated information criterion, and specified based on the specified candidate for division
  • a smooth function indicating an average of the objective variable in the domain of the explanatory variable and the objective variable in the domain of the explanatory variable based on the calculated average and variance in each domain Respectively calculates a smooth function which indicates the dispersion comprises the step.
  • the first recording medium of the present invention is an observation that includes information indicating an explanatory variable and an objective variable whose values are observed with respect to the explanatory variable and whose mean and variance depend on the explanatory variable.
  • a parameter estimation process for calculating an average and a variance of the objective variable for each area specified based on a division candidate that is information for dividing the domain of the explanatory variable into a plurality of areas based on the data; and
  • An optimal division specifying process for calculating an information amount criterion for the division candidate based on the data, the average and variance of the calculated objective variable, and specifying one division candidate based on the calculated information criterion;
  • a slip indicating an average of the objective variable in a domain of the explanatory variable based on the calculated average and variance in each area specified based on the specified division candidate.
  • a smoothing process configured to calculate a smooth function indicating a distribution of the objective variables in the domain of kana function and the explanatory variables, the program for the execution records.
  • the present invention can perform accurate regression analysis even when the mean and variance of the objective variable depend on explanatory variables that take continuous values.
  • FIG. 1 is a block diagram showing the configuration of the information processing apparatus according to the first embodiment of this invention.
  • FIG. 2 is a diagram showing the relationship between the position and dispersion of the explanatory variable x and the function w i (x).
  • FIG. 3 is a flowchart showing the operation of the information processing apparatus according to the first embodiment of this invention.
  • FIG. 4 is an example showing the relationship between the elevation angle and the signal error in the pseudo data generated by the simulation.
  • FIG. 5 is a flowchart illustrating the operation of the information processing apparatus according to the second embodiment.
  • FIG. 6 is an example of the result of estimating the variance of the signal error in the second embodiment.
  • FIG. 7 is a block diagram illustrating a configuration of the information processing apparatus according to the third embodiment.
  • FIG. 1 is a block diagram showing the configuration of the first embodiment of the present invention.
  • an information processing apparatus 11 includes an input unit 101, a division candidate management unit 102, a parameter estimation unit 103, an optimal division identification unit 104, and a smoothing unit. 105.
  • the input unit 101 is connected to the parameter estimation unit 103, the optimum division specifying unit 104, and the smoothing unit 105.
  • the division candidate management unit 102 is connected to the parameter estimation unit 103.
  • the parameter estimation unit 103 is connected to the input unit 101, the division candidate management unit 102, the optimal division identification unit 104, and the smoothing unit 105, respectively.
  • the optimum division specifying unit 104 is connected to the input unit 101, the parameter estimation unit 103, and the smoothing unit 105, respectively.
  • the smoothing unit 105 is connected to the input unit 101, the parameter estimation unit 103, the optimum division specifying unit 104, and the smoothing unit 105, respectively.
  • the input unit 101 has n sets of observation data (y ⁇ , X ⁇ ).
  • is an integer of 1 to n.
  • the input unit 101 includes an interface circuit for data input / output.
  • Observation data (y ⁇ , X ⁇ ) For the input of the observation data (y ⁇ , X ⁇ ) May be a sensor input means or a communication means.
  • the division candidate management unit 102 performs a first calculation for calculating a division candidate based on information indicating the domain R of x, the maximum value M of the number of divisions when dividing R, and the minimum unit ⁇ x of each area.
  • a circuit may be provided and the calculation result may be stored in a memory.
  • the user of the information processing apparatus 11 may set R, M, and ⁇ x in the division candidate management unit 102 in advance.
  • the division candidate management unit 102 may receive information indicating R, M, and ⁇ x from the outside. Alternatively, the division candidate management unit 102 may receive R, M, and ⁇ x via the input unit 101. In any case, the first arithmetic circuit of the division candidate management unit 102 determines the R division candidates R based on the set or received information. c Is calculated. Here, division candidate R c Further explanation will be given. [Candidate R] c Indicates a division of R that can be expressed in a space in which the number of divided areas is M or less and the boundary surface of each area is a constant multiplied by each component of ⁇ x.
  • each region identified based on i (C) Each division candidate R of R c Is expressed as [Equation 4].
  • r i (C) I is 1 or more m (C) The following integers.
  • C indicates the number of R division candidates.
  • m (C) And M is m (C) ⁇ M is satisfied.
  • c is an integer of 1 or more and C or less. For example, if the explanatory variable x is an angle and ⁇ x is 5 degrees, each region r i (C) The range of angles at is an integer multiple of ⁇ x, ie a multiple of 5.
  • the parameter estimation unit 103 receives observation data (y ⁇ , X ⁇ ) And R division candidates R c Based on each region r i (C) A second arithmetic circuit for calculating and outputting an average value and an estimated value of variance of the objective variable y.
  • the second arithmetic circuit of the parameter estimation unit 103 includes each region r i (C) It is assumed that the mean and variance of the objective variable y in are constants, and the respective estimated values are obtained by the maximum likelihood estimation method.
  • a certain division candidate R c Explanatory variable X (x 1 ,. . .
  • the optimal division specifying unit 104 determines the division candidate R based on the mean and variance estimated values of the objective variable y output from the parameter management unit 103. c A third arithmetic circuit for calculating each information criterion. The optimum division specifying unit 104 then assigns the division candidate R corresponding to the smallest information criterion. * Is identified as the optimal partition.
  • an information amount standard applied for calculation by the third arithmetic circuit for example, there is an AIC (Akaike's Information Criterion) expressed by the following [Equation 8].
  • AIC Alkaike's Information Criterion
  • BIC Bayesian Information Criterion
  • the smoothing unit 105 uses the estimated value of the variance of the objective variable y estimated by the parameter estimation unit 103 to smoothly indicate the estimated value of the variance of the objective variable y on the domain R of the explanatory variable x. Calculate the function. Specifically, the smoothing unit 105 performs optimal division R * Each region r i ' (*) Explanatory variables x included in each ⁇ In each region and its explanatory variable x ⁇ And a fourth arithmetic circuit that calculates the smooth function described above based on the dispersion of. However, i 'is 1 or more m (*) The following integers.
  • the fourth arithmetic circuit of the smoothing unit 105 calculates a smooth function on R expressed by the following [Equation 10].
  • the smooth function is a continuous function on R obtained by approximating the average estimation value or the variance estimation value in each region so as to connect them smoothly.
  • each variable included in [Equation 10] satisfies the relationship indicated by [Equation 11].
  • [Equation 10] indicates that the average estimated value of the objective variable y and the estimated value of the variance are the optimal division R *
  • Each region r i ' (*) Parameter w between mean and variance estimates in i ' It is represented by a weighted average with (x) as a weight.
  • [Equation 11] represents each region r.
  • Figure 2 shows the position and dispersion of the explanatory variable x and the function w i ' This shows the relationship with (x).
  • the average of the explanatory variable x is used as the position of the explanatory variable x
  • the variance of the explanatory variable x is used as the dispersion of the explanatory variable x.
  • the vertical axis direction represents the function weight
  • the horizontal axis direction represents the domain of explanatory variables.
  • the line graph is a function w. i ' (X) is shown, and a plurality of points indicate positions on the domain of each explanatory variable. 2
  • the function w increases as the value of the explanatory variable x is closer to the average.
  • Equation 10 indicates that the average estimated value and the estimated variance value of the objective variable y are calculated by the same calculation method as the kernel density estimation. Examples of this calculation method include an analysis method using a kernel function.
  • the kernel density estimation is one of methods for estimating the probability density function of a random variable.
  • the smoothing unit 105 outputs a smooth function indicating the average estimated value of the objective variable y on the domain R of the explanatory variable x.
  • the smoothing unit 105 outputs a smooth function indicating an estimated value of the variance of the objective variable y on the domain R of the explanatory variable x.
  • the smoothing unit 105 may pass the above-described information to an output unit (not shown), and the output unit may output the received information.
  • the first arithmetic circuit in the division candidate management unit 102 described above may execute calculation processing by program control with one or more CPUs (Central Processing Units) and a memory.
  • the second arithmetic circuit in the parameter estimation unit 103 described above may execute the calculation process by program control with one or more CPUs and memories.
  • the third arithmetic circuit in the optimum division specifying unit 104 may execute the calculation process by program control using one or more CPUs and memories.
  • the fourth arithmetic circuit in the smoothing unit 105 may execute the calculation process by program control using one or more CPUs and a memory.
  • FIG. 3 is a flowchart showing an example of an outline of the operation of the information processing apparatus 11 according to the first embodiment of the present invention.
  • the input unit 101 has n sets of observation data (y ⁇ , X ⁇ ). Further, the input unit 101 receives information regarding the domain of R of x, the maximum value M of the number of divisions when dividing R, and the minimum unit ⁇ x of each region (step S201).
  • the division candidate management unit 102 calculates a division candidate based on the information on the domain of R of x, the maximum value M of the number of divisions when dividing R, and the minimum unit ⁇ x of each area (step S202).
  • the parameter estimation unit 103 uses the observation data (y ⁇ , X ⁇ ) And R division candidates R c Based on region r i (C) Every time, an average estimated value of the objective variable y in the region is calculated (step S203).
  • the parameter estimation unit 103 uses the observation data (y ⁇ , X ⁇ ) And R division candidates R c Based on region r i (C) Every time, an estimated value of the variance of the objective variable y in the region is calculated (step S204).
  • the optimal division specifying unit 104 determines the division candidate R based on the average estimated value and variance estimated value of the objective variable y output from the parameter managing unit 103. c Each information criterion is calculated for each.
  • the optimum division specifying unit 104 then assigns the division candidate R corresponding to the smallest information criterion. * Is identified as the optimal division (step S205).
  • the smoothing unit 105 calculates a smooth function of the average estimated value of the objective variable y on the domain R of the explanatory variable x (step S206). Further, the smoothing unit 105 calculates a smooth function of the estimated value of the variance of the objective variable y on the domain R of the explanatory variable x (step S207). Specifically, the smoothing unit 105 performs optimal division R * Each region r i ' (*) Explanatory variables x included in each ⁇ In each region and its explanatory variable x ⁇ A desired smooth function is calculated on the basis of the dispersion of. The smoothing unit 105 outputs a smooth function of the average estimated value of the objective variable y on the domain R of the explanatory variable x.
  • the smoothing unit 105 outputs a smooth function of the estimated value of the variance of the objective variable y on the domain R of the explanatory variable x.
  • the information processing apparatus 11 divides the definition area of the explanatory variable into a plurality of areas, and estimates a desired average and variance for each area by a model that can identify the average and variance of the objective variable by easy calculation. To do. Therefore, even when the mean and variance of the objective variable depend on explanatory variables that take continuous values, the information processing apparatus 11 according to the present embodiment can easily estimate the mean and variance of the objective variable. it can. The information processing apparatus 11 according to the present embodiment can simultaneously estimate the mean and variance of the objective variable. Further, when the mean and variance of the objective variable are nonlinear or discontinuous functions, that is, when they change complicatedly, these functions can be expressed by a combination of simple models.
  • the information processing apparatus 11 according to the present embodiment can easily and appropriately estimate the mean and variance of the objective variable. Since the information processing apparatus 11 according to the present embodiment can estimate the mean and variance of the objective variable even when the mean and variance of the objective variable depend on the explanatory variables taking continuous values, accurate regression Analyze. For example, when the explanatory variable is information indicating physical coordinates in the geometric space, the information processing apparatus 11 according to the present embodiment can accurately perform a regression analysis on an event whose value changes according to the coordinates. Is possible. Further, when the explanatory variable is information indicating time, the information processing apparatus 11 according to the present embodiment can accurately perform a regression analysis of an event whose value changes according to the time.
  • the information processing apparatus 11 can be applied to a field where accuracy of data such as aircraft landing guidance is required for the above reason.
  • the information processing apparatus 11 of the present embodiment formulates the mean and variance of the objective variable as a smooth function. Therefore, it is possible to reduce the calculation amount or calculation time required for regression analysis without requiring complicated calculation.
  • the variance of the objective variable y is constant regardless of the value of the explanatory variable x. That is, in the general regression model, the uniformity of the variance of the objective variable is assumed.
  • the reason is that when the regression function u (x; w) is an appropriate function for the data to be subjected to regression analysis, it is natural to assume that the magnitude of error in each objective variable is constant. is there.
  • the information processing system converts data based on knowledge about the structure of the heterogeneity of the dispersion of objective variables.
  • the information processing apparatus 11 in the present embodiment does not assume the uniformity of the variance of the objective variable during the regression analysis. Therefore, the information processing apparatus 11 can perform regression analysis based on data in which the variance of the objective variable is not uniform. Further, the information processing apparatus 11 according to the present embodiment also analyzes the dependency of the objective variable distribution itself. Therefore, it is not necessary for the user of the information processing apparatus 11 to know information indicating the dependency relationship between the objective variable and the explanatory variable in advance.
  • the second embodiment is an example showing a specific operation of the information processing apparatus 11 of the first embodiment.
  • the configuration of the information processing apparatus 11 in the second embodiment is the same as the configuration of the first embodiment. Therefore, the description is omitted.
  • the second embodiment is a specific example in which the information processing apparatus 11 estimates the variance of the signal error as the objective variable when given the elevation angle as the explanatory variable.
  • GPS Global Positioning System
  • this landing guidance system is required to accurately measure the magnitude (variance) of the error of the satellite signal.
  • the signal error greatly depends on the elevation angle of the artificial satellite viewed from the ground.
  • FIG. 4 is a diagram showing the relationship between the signal error and the elevation angle in the pseudo observation data generated by the simulation.
  • FIG. 4 the vertical axis represents the signal error, and the horizontal axis represents the elevation angle.
  • the signal error is normalized so that the average becomes zero.
  • the elevation angle takes a value in the range from 0 to 90 degrees.
  • the information processing apparatus 11 can estimate the magnitude of the signal error as the objective variable, that is, the variance of the signal error from the observation data, given the elevation angle as the explanatory variable.
  • FIG. 5 is a flowchart showing an outline of the operation of the information processing apparatus 11 in the second embodiment of the present invention.
  • the input unit 101 receives information indicating the elevation angle x of each artificial satellite and information indicating the signal error y in association with each other from a ground receiver (not shown) as observation data.
  • the number of terrestrial receivers is not limited to one.
  • one terrestrial receiver may perform the following information processing.
  • a plurality of terrestrial receivers may perform the following information processing, and the terrestrial receiver or another device may output one result based on the information processing result output by each.
  • the input unit 101 receives the following information.
  • the input unit 101 receives information indicating the elevation angle of each artificial satellite viewed from the ground receiver from the ground receiver.
  • the terrestrial receiver may be a part of the components of the input unit 101.
  • the ground receiver may be provided in a device different from the information processing device 11.
  • the input unit 101 receives information indicating the geometric distance between each artificial satellite and the terrestrial receiver, measured by the terrestrial receiver.
  • the input unit 101 receives information indicating a pseudorange calculated from the carrier phase of a GPS signal received by the terrestrial receiver from an artificial satellite.
  • the input unit 101 calculates a signal error y based on the difference between the geometric distance and the pseudo distance (step S301). Thereby, the input unit 101 displays observation data (y that includes information indicating the elevation angle x and information indicating the error y). ⁇ , X ⁇ ) Is generated.
  • the user of the information processing apparatus 11 inputs the elevation angle definition area R, the maximum value M of the number of divisions when dividing the elevation angle definition area R, and the minimum unit ⁇ x of each area into the input unit 101 or the division candidate management unit 102.
  • R 90 degrees
  • M 90
  • ⁇ x 1 degree. This is an example, and each value is not limited.
  • the division candidate management unit 102 divides the division candidate R based on the information on the definition domain R of x, the maximum value M of the number of divisions when dividing R, and the minimum unit ⁇ x of each area. c Is calculated (step S302).
  • the parameter estimation unit 103 uses the observation data (y ⁇ , X ⁇ ) And R division candidates R c Based on region r i (C) Every time, an estimated value of the variance of the signal error y in the region is calculated (step S303).
  • Optimized division identification unit 104 is a division candidate R c Each information criterion is calculated for each.
  • the optimum division specifying unit 104 then assigns the division candidate R corresponding to the smallest information criterion. * Is identified as the optimal division (step S304).
  • the smoothing unit 105 calculates a smooth function of the estimated value of the variance of the signal error y on the domain R of the elevation angle x (step S305).
  • FIG. 6 shows an estimation result by the information processing apparatus 11 in the present embodiment.
  • a line written symmetrically with respect to the horizontal axis is a function representing an estimated value of the standard deviation (positive square root of variance) of the signal error.
  • FIG. 6 shows that the variance of the signal error increases as the elevation angle decreases. That is, FIG. 6 shows the dependence of the signal error on the elevation angle.
  • the information processing apparatus 41 includes a parameter estimation unit 403, an optimal division identification unit 404, and a smoothing unit 405.
  • the parameter estimation unit 403 is connected to the optimum division specifying unit 404 and the smoothing unit 405, respectively.
  • the optimum division identification unit 404 is connected to the parameter estimation unit 403 and the smoothing unit 405, respectively.
  • the smoothing unit 405 is connected to the parameter estimation unit 403, the optimum division specifying unit 404, and the smoothing unit 405, respectively.
  • the parameter estimation unit 403 calculates the mean and variance of the objective variable for each area specified based on the division candidate, which is information for dividing the definition area of the explanatory variable into a plurality of areas, based on the observation data.
  • the observation data is a set of information indicating an explanatory variable and a value observed for the explanatory variable, and an objective variable whose mean and variance depend on the explanatory variable.
  • the optimal division specifying unit 404 calculates the information criterion of the division candidate based on the above observation data and the average and variance of the objective variable calculated by the parameter estimation unit 403. Then, the optimum division specifying unit 404 generates one division candidate R based on the calculated information criterion. * Is identified as the optimal partition.
  • Smoothing unit 405 is the division candidate R * Based on the average calculated by the parameter estimation unit 403 in each region specified based on the above, a smooth function indicating the average of the objective variables in the domain of the explanatory variables is calculated. Further, the smoothing unit 405 performs division candidate R * Based on the variance calculated by the parameter estimation unit 403 in each region specified based on the above, a smooth function indicating the variance of the objective variable in the domain of the explanatory variable is calculated.
  • the operation of the information processing apparatus 41 shown in FIG. 7 is the same as that of the information processing apparatus 11 shown in the first embodiment of the present invention.
  • the information processing apparatus 41 divides the definition area of the explanatory variable into a plurality of areas, and estimates a desired average and variance for each area by a model that can identify the average and variance of the objective variable by easy calculation. Therefore, the information processing apparatus 41 according to the third embodiment of the present invention can achieve the same effects as the information processing apparatus 11 according to the first embodiment.
  • each embodiment described so far is a preferred embodiment of the present invention, and the scope of the present invention is not limited to the above embodiment.
  • Each embodiment can be implemented in various forms without departing from the gist of the present invention.
  • each component in each embodiment of the present invention can be realized by a computer and a program as well as its function in hardware.
  • the program is provided by being recorded on a computer-readable recording medium such as a magnetic disk or a semiconductor memory, and is read by the computer when the computer is started up.
  • the read program causes the computer to function as a component in each of the embodiments described above by controlling the operation of the computer.
  • An example of the effect of the present invention is that accurate regression analysis can be performed even when the mean and variance of the objective variable depend on explanatory variables taking continuous values.
  • the information processing apparatus can be applied to regression analysis that estimates the mean and variance of an objective variable when the mean and variance of the objective variable depend on explanatory variables.
  • the explanatory variable is information indicating physical coordinates in the geometric space
  • the information processing apparatus can be applied to the following technique.
  • ⁇ Analysis of radio wave strength of mobile phones ⁇ Analysis of sensor errors using radio
  • ⁇ Analysis of geological components (soil components) ⁇ Analysis of water quality data in rivers and seas
  • the information processing apparatus can be applied to the following technique.
  • ⁇ Analysis of temperature and hardness of parts in the manufacturing process of industrial products ⁇ Analysis of acceleration after collision in automobile and motorcycle collision experiments

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Complex Calculations (AREA)
  • Telephonic Communication Services (AREA)

Abstract

情報処理装置は、目的変数の平均および分散が連続値を取る説明変数に依存している場合、正確な回帰分析ができない。 説明変数と、該説明変数に対して観測された値であり平均および分散が該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、該説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、該目的変数の平均および分散を算出し、該観測データと、該算出された目的変数の平均および分散と、に基づいて該分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定し、該特定された分割候補に基づいて特定される各領域における該算出された平均および分散に基づいて、該説明変数の定義域における該目的変数の平 均および分散をそれぞれ示す滑らかな関数をそれぞれ算出する。

Description

情報処理装置、情報処理方法および記録媒体
 本発明は、説明変数が与えられたもとでの目的変数の平均および分散を推定する情報処理装置、情報処理方法および記録媒体に関する。
 ある確率変数yが他の確率変数xに依存すると想定される場合に、回帰モデルを用いてその依存性を分析する方法がある。この方法は、回帰分析とも呼ばれる。回帰分析において、前述の確率変数yは、目的変数または従属変数と呼ばれる。また前述の確率変数xは、説明変数または独立変数と呼ばれる。
 この回帰分析の一例が非特許文献1に記載されている。非特許文献1における回帰分析は、目的変数yの分散が説明変数xの値によらずに一定であること、すなわち目的変数の分散が説明変数の定義域において均一であることを仮定している。
 また、ある確率変数yの平均と分散との両方がyの観測時刻tに依存すると想定される場合に、一般状態空間モデルを用いてその依存性を分析する方法がある。この一般状態空間モデルは、目的変数yの平均と分散との両方が目的変数yを観測した観測時刻tに依存するような時系列データに対して、目的変数yの平均と分散との依存性が表現されるモデルである。
 この分析の一例が、非特許文献2に記載されている。
小西貞則、北川源四郎著「情報量規準シリーズ・予測と発見の科学2」朝倉書店、2004年9月25日、pp.16−22、35−37 森下真一、宮野悟編「bit別冊 発見とデータマイニング」共立出版株式会社、2000年5月5日、pp.159−168
 非特許文献1に記載の技術は、目的変数の平均および分散が説明変数の定義域において均一であることを仮定している。したがって、非特許文献1に記載の技術は、目的変数の平均および分散が、説明変数に依存している場合、目的変数の平均および分散を推定することができない。すなわち、非特許文献1に記載の技術は、正確な回帰分析ができないという問題点があった。
 また、非特許文献2に記載の技術は、所定の時刻毎に観測される離散的な時系列データを対象として分析を行う。したがって、非特許文献2に記載の技術は、目的変数の平均および分散が、連続値を取る説明変数に依存している場合、目的変数の平均および分散を推定することができない。すなわち、非特許文献2に記載の技術は、正確な回帰分析ができないという問題点があった。
 本発明の目的の一例は、上述の課題を解決するための情報処理装置、情報処理方法および記録媒体を提供することにある。
 本発明の第一の情報処理装置は、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定部と、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定部と、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化部と、を備える。
 本発明の第一の情報処理方法は、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出し、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定し、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する、工程を備える。
 本発明の第一の記録媒体は、コンピュータに、説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定処理と、前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定処理と、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化処理と、を実行させるプログラムを記録する。
 本発明は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、正確な回帰分析ができる。
図1は、本発明の第一の実施の形態の情報処理装置の構成を示したブロック図である。 図2は、説明変数xの位置および散らばりと、関数w(x)との関係を示した図である。 図3は、本発明の第一の実施の形態の情報処理装置の動作を示したフローチャートである。 図4は、シミュレーションにより発生させた擬似データにおける、仰角と信号誤差との関係を示した一例である。 図5は、第二の実施の形態の情報処理装置の動作を示したフローチャートである。 図6は、第二の実施の形態における信号誤差の分散の推定を行った結果の一例である。 図7は、第三の実施の形態の情報処理装置の構成を示したブロック図である。
 次に本発明の実施の形態について、図面を参照した詳細な説明がなされる。
 本発明の実施の形態についての説明の前に、一般的な回帰モデルにおける、回帰モデルのパラメータを推定する方法についての説明がなされる。
 目的変数yと説明変数xとに関するn組の観測データのそれぞれが(yα,xα)と表されるとき、回帰モデルにおける、yαのxαに対する依存性は、[数1]のように表される。ただし、αは、1以上n以下の整数である。u(xα;w)は、回帰関数を示す。wは、回帰関数のパラメータを示す。εαは、誤差項を示す。
Figure JPOXMLDOC01-appb-M000001
 また、回帰モデルでは、一般に誤差項εαは、平均0、分散σの正規分布N(0,σ)に独立に従うものと仮定される。この場合、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fは、[数2]のように表される。
Figure JPOXMLDOC01-appb-M000002
 回帰モデルにおけるパラメータ(w’,σ)’を観測データから推定するための手法として、最尤推定法がある。最尤推定法では、確率密度関数fに対して、[数3]で表される対数尤度関数log fを最大にするパラメータの値が、所望の推定値となる。
Figure JPOXMLDOC01-appb-M000003
 以下は、発明を実施するための形態についての詳細な説明である。なお、各図面および本明細書記載の各実施の形態において、同様の機能を備える構成要素には同一の符号が与えられている。
 [第一の実施の形態]
 図1は、本発明の第一の実施の形態の構成を示すブロック図である。
 図1を参照すると、本発明の第一の実施の形態における情報処理装置11は、入力部101と、分割候補管理部102と、パラメータ推定部103と、最適分割特定部104と、平滑化部105と、を備える。
 入力部101は、パラメータ推定部103と、最適分割特定部104と、平滑化部105と、それぞれ接続されている。分割候補管理部102は、パラメータ推定部103と接続されている。パラメータ推定部103は、入力部101と、分割候補管理部102と、最適分割特定部104と、平滑化部105とそれぞれ接続されている。最適分割特定部104は、入力部101と、パラメータ推定部103と、平滑化部105とそれぞれ接続されている。平滑化部105は、入力部101と、パラメータ推定部103と、最適分割特定部104と、平滑化部105とそれぞれ接続されている。
 ===入力部101===
 入力部101は、目的変数yと説明変数xとのn組の観測データ(yα,xα)の入力を受ける。ここでαは、1以上n以下の整数である。本実施の形態では、説明変数xは、p次元ベクトルx=(x(1),...,x(p))’であるものとする。ただしpは、1以上の整数である。これは、例示であって、説明変数xは、スカラーであってもよい。
 なお、入力部101は、データの入出力のためのインターフェース回路を含む。観測データ(yα,xα)の入力のための入力部は、連続的に発生する観測データ(yα,xα)を検出および受信するセンサ入力手段や通信手段であっても良い。
 ===分割候補管理部102===
 分割候補管理部102は、xの定義域Rを複数の領域に分割する情報である分割候補をメモリに記憶する。
 分割候補管理部102は、xの定義域Rを示す情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補を算出する第1の演算回路を備え、その算出結果をメモリに記憶してもよい。Mは、2以上の整数である。xがp次元ベクトルである場合、Δxは、x=(Δx(1),...,Δx(p))’と表される。例えば、説明変数xが角度であった場合、Δxは、1度あるいは5度といった値をとってもよい。
 この情報処理装置11のユーザは、あらかじめR、MおよびΔxを分割候補管理部102の内部に設定してもよい。あるいは、分割候補管理部102は、R、MおよびΔxをそれぞれ示す情報を外部から受信してもよい。または分割候補管理部102は、入力部101を介してR、MおよびΔxを受信してもよい。いずれの場合にも、分割候補管理部102の第1の演算回路は、設定された、あるいは受信した情報に基づいて、Rの分割候補Rを算出する。
 ここで、分割候補Rについてさらに説明がなされる。
 分割候補Rは、分割される領域の数がM以下かつ各領域の境界面がΔxの各成分を定数倍した空間で表現できる、Rの分割のことを指す。分割候補Rに基づいて特定される各領域がr (c)と示されると仮定すると、Rの各分割候補Rは、[数4]のように示される。ただし、r (c)中のiは、1以上m(c)以下の整数である。また、Cは、Rの分割候補の個数を示す。m(c)およびMは、m(c)≦Mなる関係を満たす。ただし、cは、1以上C以下の整数である。
Figure JPOXMLDOC01-appb-M000004
 例えば、説明変数xが角度であり、Δxが5度である場合、各領域r (c)における角度の範囲は、Δxの整数倍、すなわち5の倍数である。
 なお、分割候補管理部102は、分割候補Rに基づいて特定される各領域r (c)を示す情報と、各分割候補Rとを対応付けてメモリに記憶するものとする。
 ===パラメータ推定部103===
 パラメータ推定部103は、分割候補管理部102よりRの分割候補Rを読み取る。そしてパラメータ推定部103は、各分割候補Rに含まれる領域r (c)毎に、その各領域における目的変数yの平均および分散の推定値をそれぞれ算出する。具体的には、パラメータ推定部103は、入力部101が入力を受ける観測データ(yα,xα)と、Rの各分割候補Rに基づいて、各領域r (c)の目的変数yの平均および分散の推定値をそれぞれ算出し出力する第2の演算回路を備える。
 また、パラメータ推定部103の第2の演算回路は、各領域r (c)における目的変数yの平均および分散が定数であるとみなし、それぞれの推定値を最尤推定法によって求める。
 本実施の形態における回帰モデルでは、ある分割候補Rにおける、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fは、以下の[数5]のように表される。
Figure JPOXMLDOC01-appb-M000005
 ただし、μ (c)は、各領域r (c)における目的変数yの平均であり、(σ (c)は、各領域r (c)における目的変数yの分散である。また、μ(c)は、μ(c)=(μ (c),...,μ (c))’なる関係を満たす。(σ(c)は、(σ(c)=((σ (c),...,(σ (c))’なる関係を満たす。
 [数5]は、領域r (c)毎に[数2]が適用されていること、各領域において観測データの分布が独立であることをそれぞれ示している。
 第一に、パラメータ推定部103は、分割候補R毎に、説明変数X=(x,...,x)’が与えられたもとでの目的変数y1:n=(y,...,y)’の確率密度関数fを[数5]に基づいて特定する。
 第二に、パラメータ推定部103は、[数6]で表される対数尤度関数log fを最大にするパラメータμ、σの値を、所望の推定値として特定する。
Figure JPOXMLDOC01-appb-M000006
 具体的には、パラメータ推定部103は、分割候補R毎に所望の推定値をそれぞれ[数7]で示される数式に基づいて推定する。
Figure JPOXMLDOC01-appb-M000007
 ===最適分割特定部104===
 最適分割特定部104は、分割候補Rの中から最適な分割候補Rを特定する。具体的には、最適分割特定部104は、パラメータ管理部103が出力する目的変数yの平均および分散の推定値に基づいて、分割候補Rごとにそれぞれの情報量規準を算出する第3の演算回路を含む。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する。
 第3の演算回路が算出のために適用する情報量規準として、例えば、以下の[数8]で表されるAIC(Akaike’s Information Criterion;赤池情報量規準)がある。さらに別の情報量規準として、例えば、[数9]で表されるBIC(Bayesian Information Criterion;ベイズ情報量規準)がある。これらは例示であって、モデルの正確性を示すあらゆる評価基準が、本実施の形態に適用されうる。
Figure JPOXMLDOC01-appb-M000008
Figure JPOXMLDOC01-appb-M000009
 最適分割特定部104は、上述の情報量規準に基づき、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する。
 ===平滑化部105===
 平滑化部105は、パラメータ推定部103が推定する目的変数yの平均の推定値を利用して、説明変数xの定義域R上における、目的変数yの平均の推定値を示す滑らかな関数を算出する。さらに、平滑化部105は、パラメータ推定部103が推定する目的変数yの分散の推定値を利用して、説明変数xの定義域R上における、目的変数yの分散の推定値を示す滑らかな関数を算出する。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる説明変数xαの各領域における位置とその説明変数xαの散らばりとに基づいて、前述の滑らかな関数を算出する第4の演算回路を含む。ただし、i’は、1以上m(*)以下の整数である。たとえば、平滑化部105の第4の演算回路は、以下の[数10]で表されるR上の滑らかな関数を算出する。この滑らかな関数とは、各領域における平均の推定値または分散の推定値を滑らかにつなぐように近似することで得られる、R上での連続関数である。
Figure JPOXMLDOC01-appb-M000010
 ただし、[数10]に含まれる各変数は、それぞれ[数11]で示される関係を満たす。
Figure JPOXMLDOC01-appb-M000011
 [数10]は、目的変数yの平均の推定値と分散の推定値とが、最適な分割Rの各領域ri’ (*)における平均の推定値と分散の推定値とのパラメータwi’(x)を重みとした、重みつき平均で表されることを示している。[数11]は、各領域ri’ (*)の重みを表す関数wi’(x)が、その領域内の説明変数xα(xα∈ri’ (*))の位置とその説明変数xαの散らばりSi’とに基づいて特定されることを示している。なお、本実施の形態では、その領域内の説明変数xαの位置とは、その領域内の説明変数xαの平均で表現されている。また、本実施の形態では説明変数xαの散らばりとは、説明変数xαの分散で表現されている。これらは、例示であって、説明変数xαの位置と説明変数xαの散らばりとは、それぞれを示す任意の指標が適用されうる。
 図2は、説明変数xの位置および散らばりと、関数wi’(x)との関係を示したものである。図2では、説明変数xの位置として説明変数xの平均が、説明変数xの散らばりとして説明変数xの分散が、それぞれ用いられている。図2において、縦軸方向は、関数の重みを示し、横軸方向は、説明変数の定義域を示している。また、図2において、線グラフは、関数wi’(x)を示し、複数の点は、各説明変数の定義域上の位置を示している。
 図2によれば、説明変数xの値が平均に近いほど関数wi’(x)の値が大きくなることを示している。また、図2によれば、説明変数xの分散が小さいほど関数wi’(x)の値が説明変数xの平均付近で急激に大きくなることを示している。
 また、[数10]は、目的変数yの平均の推定値と分散の推定値とがカーネル密度推定と同様の算出方法によって算出されることを示している。この算出方法とは、例えば、カーネル関数を用いた分析手法が挙げられる。なお、カーネル密度推定とは、確率変数の確率密度関数を推定する手法の一つである。
 以上のように、平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値を示す滑らかな関数を出力する。さらに平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値を示す滑らかな関数を出力する。また、平滑化部105は、各領域ri’ (*)内の説明変数xα(xα∈ri’ (*))の位置とその説明変数xαの散らばりSi’と説明変数X=(x,...,x)’とを出力する。ここで、平滑化部105は、上述の各情報を図示しない出力部に渡し、その出力部が、受け取った各情報を出力してもよい。
 前述した分割候補管理部102における第1の演算回路は、1つまたは2つ以上のCPU(Central Processing Unit)とメモリとによるプログラム制御によって算出処理を実行してもよい。同様に、前述したパラメータ推定部103における第2の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。前述の最適分割特定部104における第3の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。前述の平滑化部105における第4の演算回路は、1つまたは2つ以上のCPUとメモリとによるプログラム制御によって算出処理を実行してもよい。
 図3は、本発明の第一の実施の形態における情報処理装置11の動作の概要の一例を示すフローチャートである。
 入力部101は、目的変数yと説明変数xとのn組の観測データ(yα,xα)の入力を受ける。また、入力部101は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxを受け取る(ステップS201)。分割候補管理部102は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補を算出する(ステップS202)。
 パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における目的変数yの平均の推定値を算出する(ステップS203)。また、パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における目的変数yの分散の推定値を算出する(ステップS204)。
 最適分割特定部104は、パラメータ管理部103が出力する目的変数yの平均の推定値および分散の推定値に基づいて、分割候補Rごとにそれぞれの情報量規準を算出する。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する(ステップS205)。
 平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値の滑らかな関数を算出する(ステップS206)。また、平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値の滑らかな関数を算出する(ステップS207)。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる説明変数xαの各領域における位置とその説明変数xαの散らばりとに基づいて、所望の滑らかな関数を算出する。
 平滑化部105は、説明変数xの定義域R上における、目的変数yの平均の推定値の滑らかな関数を出力する。また、平滑化部105は、説明変数xの定義域R上における、目的変数yの分散の推定値の滑らかな関数を出力する。また、平滑化部105は、各領域r (*)内の説明変数xα(xα∈r (*))の位置とその説明変数xαの散らばりSと説明変数X=(x,...,x)’とを出力する(ステップS208)。
 本実施の形態の情報処理装置11は、説明変数の定義域を複数の領域に分割し、その領域毎に目的変数の平均および分散を容易な計算によって特定できるモデルによって所望の平均および分散を推定する。したがって、目的変数の平均および分散が連続値を取る説明変数に依存している場合であっても、本実施の形態の情報処理装置11は、簡単に目的変数の平均および分散を推定することができる。そして本実施の形態の情報処理装置11は、目的変数の平均と分散とを同時に推定することができる。また、目的変数の平均および分散が非線形もしくは不連続な関数である場合、すなわち複雑な変化をする場合、これらの関数は単純なモデルの組み合わせにより表現されうる。したがって、本実施の形態の情報処理装置11は、容易にかつ適切に目的変数の平均および分散を推定することができる。
 本実施の形態の情報処理装置11は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、目的変数の平均および分散を推定することができるので、正確な回帰分析ができる。
 例えば、本実施の形態の情報処理装置11は、説明変数が、幾何学空間における物理的な座標を示す情報である場合、その座標に応じて値が変化する事象を正確に回帰分析することが可能である。また、本実施の形態の情報処理装置11は、説明変数が、時刻を示す情報である場合、その時刻に応じて値が変化する事象を正確に回帰分析することが可能である。特に本実施の形態の情報処理装置11は、以上の理由により、航空機の着陸誘導といったデータの正確性が要求される分野においても適用可能である。
 本実施の形態の情報処理装置11は、目的変数の平均および分散を滑らかな関数として定式化する。したがって複雑な計算を必要とせず、回帰分析にかかる計算量あるいは計算時間を減らすことが可能となる。
 一般的な回帰モデルでは、目的変数yの分散が、説明変数xの値によらず一定であることが仮定されている。すなわち一般的な回帰モデルでは、目的変数の分散の均一性が、仮定されている。その理由は、回帰分析の対象とするデータに対して回帰関数u(x;w)が適切な関数である場合、各目的変数における誤差の大きさは一定であると仮定するのが自然だからである。また、一般的な回帰モデルでは、目的変数の平均と分散とがそれぞれ説明変数に依存する場合、それぞれのパラメータの推定が非常に困難になる、という数学的な理由がある。したがって目的変数の分散が均一でないデータに基づいた回帰分析において、分散の均一性を前提とする回帰モデルが適用されることは適切ではない。
 目的変数の分散が均一でない場合における一般的な回帰分析の方法として、例えば加重最小二乗法やBox−Cox変換がある。これらの方法では、情報処理装置は、目的変数の分散の均一性が満たされるようにデータを変換し、変換したデータについて通常の回帰モデルを当てはめるものである。したがって、これらの方法では、目的変数と説明変数との依存関係を示す情報をあらかじめ情報処理装置のユーザが知っていなければ分析することができない。なぜなら、これらの方法では情報処理システムは目的変数の分散の不均一性の構造に関する知識に基づいてデータを変換するからである。
 本実施の形態における情報処理装置11は、回帰分析の際、目的変数の分散の均一性を仮定しない。したがって、情報処理装置11は、目的変数の分散が均一でないデータに基づいて回帰分析することができる。また、本実施の形態における情報処理装置11は、目的変数の分散の依存性そのものをも分析する。したがって、目的変数と説明変数との依存関係を示す情報をあらかじめ情報処理装置11のユーザが知る必要はない。
[第二の実施の形態]
 第二の実施の形態は、第一の実施の形態の情報処理装置11の具体的な動作を示した一例である。第二の実施の形態における情報処理装置11の構成は、第一の実施の形態の構成と同様である。したがって説明は、省略される。なお、第二の実施の形態は、情報処理装置11が説明変数としての仰角が与えられたもとでの目的変数としての信号誤差の分散を推定する具体的な一例である。
 現在、航空機の高精度の着陸を可能とするために、GPS(Global Positioning System)などの人工衛星を利用した着陸誘導システムが研究されている。より安全な着陸誘導システムを構築するために、この着陸誘導システムは、人工衛星信号の誤差の大きさ(分散)を正確に測ることが求められる。一方、信号誤差は、地上から見た人工衛星の仰角に大きく依存する。
 図4は、シミュレーションにより発生させた擬似的な観測データにおける、信号誤差と仰角との関係を示した図である。図4において、縦軸は信号誤差を、横軸は仰角を、それぞれ示している。本実施の形態では、信号誤差は、平均が0となるように正規化されている。また仰角は、0度から90度までの範囲の値を取るものとする。
 本実施の形態の情報処理装置11は、説明変数としての仰角が与えられたもとでの目的変数としての信号誤差の大きさ、すなわち信号誤差の分散を観測データから推定することができる。
 図5は、本発明の第二の実施の形態における情報処理装置11の動作の概要を示すフローチャートである。
 入力部101は、図示されない地上受信機から、各人工衛星の仰角xを示す情報と信号誤差yを示す情報とを対応付けて観測データとして受信する。なお、以下では地上受信機は一つ存在するものと仮定されるが、地上受信機の個数は一つに限定されない。地上受信機が複数ある場合には、一つの地上受信機が以下に示す各情報処理を行ってもよい。あるいは、複数の地上受信機が以下に示す各情報処理を行い、それぞれが出力する情報処理の結果に基づいて、地上受信機または他の装置が一つの結果を出力してもよい。
 具体的には、入力部101は以下に示す情報を受信する。第一に入力部101は、地上受信機から見た各人工衛星の仰角を示す情報をその地上受信機から受信する。なお、地上受信機は、入力部101の構成要素の一部であっても良い。あるいは、地上受信機は情報処理装置11とは異なる装置に備えられていてもよい。第二に入力部101は、その地上受信機が測定した、各人工衛星と当該地上受信機との幾何学距離を示す情報を受信する。第三に入力部101は、この地上受信機が人工衛星から受信するGPS信号の搬送波位相から計算される擬似距離を示す情報を受信する。入力部101は、この幾何学距離と擬似距離との差に基づいて信号誤差yを算出する(ステップS301)。これにより、入力部101は、仰角xを示す情報と、誤差yを示す情報とを含む観測データ(yα,xα)を生成する。
 情報処理装置11のユーザは、あらかじめ仰角の定義域R、仰角の定義域Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxを入力部101または分割候補管理部102において設定しておく。本実施の形態では、R=90度、M=90、Δx=1度が成立すると仮定される。これは、例示であってそれぞれの値が限定されるものではない。
 分割候補管理部102は、xの定義域Rに関する情報、Rを分割する際の分割数の最大値M、および、各領域の最小単位Δxに基づいて、分割候補Rを算出する(ステップS302)。パラメータ推定部103は、観測データ(yα,xα)と、Rの各分割候補Rに基づいて、領域r (c)毎にその領域における信号誤差yの分散の推定値を算出する(ステップS303)。
 最適分割特定部104は、分割候補Rごとにそれぞれの情報量規準を算出する。そして、最適分割特定部104は、もっとも小さな情報量規準に対応する分割候補Rを最適な分割として特定する(ステップS304)。
 平滑化部105は、仰角xの定義域R上における、信号誤差yの分散の推定値の滑らかな関数を算出する(ステップS305)。具体的には、平滑化部105は、最適な分割Rの各領域ri’ (*)にそれぞれ含まれる仰角xαの各領域における位置とその仰角xαの散らばりとに基づいて、所望の滑らかな関数を算出する。そして、平滑化部105は、仰角xの定義域R上における、信号誤差yの分散の推定値の滑らかな関数を出力する。また、平滑化部105は、各領域ri’ (*)内の仰角xα(xα∈ri’ (*))の位置とその仰角xαの散らばりSと仰角X=(x,...,x)’とを出力する(ステップS306)。平滑化部105は、この情報処理装置11のユーザが指定したフォーマットによりこれらの情報を出力してもよい。このフォーマットは、通常、特定のプログラミング言語の関数の形式である。
 図6は、本実施の形態における情報処理装置11による推定結果を表わしている。図6中の、横軸に関して線対称に書かれた線が、信号誤差の標準偏差(分散の正の平方根)の推定値を表わす関数である。図6は、低仰角ほど信号誤差の分散が大きくなることを示している。すなわち図6は、信号誤差の仰角に対する依存性を示している。
[第三の実施の形態]
 図7は、本発明の第三の実施の形態における情報処理装置41の構成例を示すブロック図である。
 情報処理装置41は、パラメータ推定部403と、最適分割特定部404と、平滑化部405とを備える。
 パラメータ推定部403は、最適分割特定部404と、平滑化部405とそれぞれ接続されている。最適分割特定部404は、パラメータ推定部403と、平滑化部405とそれぞれ接続されている。平滑化部405は、パラメータ推定部403と、最適分割特定部404と、平滑化部405とそれぞれ接続されている。
 パラメータ推定部403は、観測データに基づいて、説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、目的変数の平均および分散を算出する。観測データは、説明変数と、その説明変数に対して観測された値であり、平均および分散がその説明変数に依存するような目的変数と、をそれぞれ示す情報の組である。
 最適分割特定部404は、前述の観測データと、パラメータ推定部403が算出した目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出する。そして、最適分割特定部404は、算出した情報量規準に基づいて一つの分割候補Rを最適な分割として特定する。
 平滑化部405は、分割候補Rに基づいて特定される各領域における、パラメータ推定部403が算出した平均に基づいて、説明変数の定義域における目的変数の平均を示す滑らかな関数を算出する。さらに平滑化部405は、分割候補Rに基づいて特定される各領域における、パラメータ推定部403が算出した分散に基づいて、説明変数の定義域における目的変数の分散を示す滑らかな関数をそれぞれ算出する。
 図7に示される情報処理装置41の動作は、本発明の第一の形態に示された情報処理装置11と同様である。情報処理装置41は、説明変数の定義域を複数の領域に分割し、その領域毎に目的変数の平均および分散を容易な計算によって特定できるモデルによって所望の平均および分散を推定する。したがって、本発明の第三の実施の形態の情報処理装置41は、第一の実施の形態の情報処理装置11と同様の効果を奏することができる。
 以上、これまで述べてきた各実施の形態は、本発明の好適な実施形態であり、上記実施の形態のみに本発明の範囲を限定するものではない。各実施の形態は、本発明の要旨を逸脱しない範囲において種々の変更を施した形態での実施が可能である。
 また、本発明の各実施の形態における各構成要素は、その機能をハードウェア的に実現することはもちろん、コンピュータとプログラムとで実現することができる。プログラムは、磁気ディスクや半導体メモリなどのコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施の形態における構成要素として機能させる。
 本発明の効果の一例は、目的変数の平均および分散が連続値を取る説明変数に依存している場合においても、正確な回帰分析ができることである。
 この出願は、2009年12月15日に出願された日本出願特願2009−284304を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
 各実施の形態による情報処理装置は、目的変数の平均および分散が、説明変数に依存している場合において、目的変数の平均および分散を推定する回帰分析に適用できる。
 説明変数が、幾何学空間における物理的な座標を示す情報である場合、例えば、各実施の形態による情報処理装置は、次のような技術に適用できる。
・携帯電話の電波の強さの分析
・無線を用いたセンサの誤差の分析
・地質(土壌の成分)の成分分析
・川や海における水質データの分析
・地価の分布の解析
・交通量の変化の調査
 また、説明変数が、時刻を示す情報である場合、例えば、各実施の形態による情報処理装置は、次のような技術に適用できる。
・工業製品の製造工程における部品の温度や硬度の解析
・自動車やオートバイの衝突実験での衝突後からの加速度の分析
 11  情報処理装置
 41  情報処理装置
 101  入力部
 102  分割候補管理部
 103  パラメータ推定部
 104  分割特定部
 105  平滑化部
 403  パラメータ推定部
 404  分割特定部
 405  平滑化部

Claims (10)

  1.  説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定部と、
     前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定部と、
     前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数および前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数をそれぞれ算出する平滑化部と、
     を備える、情報処理装置。
  2.  請求項1に記載の情報処理装置であって、
     前記パラメータ推定部は、前記分割候補で特定される各領域における平均および分散は正規分布に従うと仮定して、前記各領域毎に前記目的変数の平均および分散を算出する、情報処理装置。
  3.  請求項1または2に記載の情報処理装置であって、
     前記最適分割特定部は、前記算出された情報量規準の最も小さい分割候補を特定する、情報処理装置。
  4.  請求項1ないし3のいずれか1項に記載の情報処理装置であって、
     前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散と、当該各領域に含まれる前記説明変数の当該領域上の位置と、に基づいて各滑らかな関数をそれぞれ算出する、情報処理装置。
  5.  請求項1ないし4のいずれか1項に記載の情報処理装置であって、
     前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散と、当該各領域に含まれる前記説明変数の散らばりと、に基づいて各滑らかな関数をそれぞれ算出する、情報処理装置。
  6.  請求項1ないし5のいずれか1項に記載の情報処理装置であって、
     前記平滑化部は、前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に対しカーネル関数を算出し、当該カーネル関数に基づき各滑らかな関数をそれぞれ算出する、情報処理装置。
  7.  請求項1ないし6のいずれか1項に記載の情報処理装置であって、
     前記観測データと、前記説明変数の定義域を示す情報と、前記説明変数の定義域を分割する際の領域の数の最大値と、当該各領域の最小単位と、に基づいて前記分割候補を算出する分割候補管理部を備え、
     前記パラメータ推定部は、前記算出された分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出する、情報処理装置。
  8.  請求項1ないし7のいずれか1項に記載の情報処理装置であって、
     前記情報量規準は、赤池情報量規準またはベイズ情報量規準のいずれかである、情報処理装置。
  9.  説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出し、
     前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定し、
     前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数および前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数をそれぞれ算出する、工程を備える、情報処理方法。
  10.  コンピュータに、
     説明変数と、前記説明変数に対して観測された値であり平均および分散が当該説明変数に依存する目的変数と、をそれぞれ示す情報を含む観測データに基づいて、前記説明変数の定義域を複数の領域に分割する情報である分割候補に基づいて特定される領域毎に、前記目的変数の平均および分散を算出するパラメータ推定処理と、
     前記観測データと、前記算出された目的変数の平均および分散と、に基づいて前記分割候補の情報量規準を算出し、算出された情報量規準に基づいて一つの分割候補を特定する最適分割特定処理と、
     前記特定された分割候補に基づいて特定される各領域における前記算出された平均および分散に基づいて、前記説明変数の定義域における前記目的変数の平均を示す滑らかな関数および前記説明変数の定義域における前記目的変数の分散を示す滑らかな関数をそれぞれ算出する平滑化処理と、を実行させるためのプログラムを記録した記録媒体。
PCT/JP2010/072311 2009-12-15 2010-12-07 情報処理装置、情報処理方法および記録媒体 WO2011074509A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2011546098A JP5692091B2 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法およびコンピュータプログラム
EP10837535.3A EP2515260A4 (en) 2009-12-15 2010-12-07 Information processing device, information processing method, and storage medium
US13/515,554 US9104641B2 (en) 2009-12-15 2010-12-07 Information processing device, method of processing information and storage medium
KR1020127015349A KR101303417B1 (ko) 2009-12-15 2010-12-07 정보 처리 장치, 정보 처리 방법 및 기록 매체
CN201080056544.XA CN102656581B (zh) 2009-12-15 2010-12-07 信息处理设备、信息处理方法和存储介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-284304 2009-12-15
JP2009284304 2009-12-15

Publications (1)

Publication Number Publication Date
WO2011074509A1 true WO2011074509A1 (ja) 2011-06-23

Family

ID=44167262

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/072311 WO2011074509A1 (ja) 2009-12-15 2010-12-07 情報処理装置、情報処理方法および記録媒体

Country Status (6)

Country Link
US (1) US9104641B2 (ja)
EP (1) EP2515260A4 (ja)
JP (1) JP5692091B2 (ja)
KR (1) KR101303417B1 (ja)
CN (1) CN102656581B (ja)
WO (1) WO2011074509A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019197267A (ja) * 2018-05-07 2019-11-14 株式会社日立製作所 データ不足提示システムおよびデータ不足提示方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5967017B2 (ja) * 2013-05-31 2016-08-10 Jfeスチール株式会社 影響因子抽出方法およびプログラム
US10445444B2 (en) * 2014-08-01 2019-10-15 Nec Corporation Flow rate prediction device, mixing ratio estimation device, method, and computer-readable recording medium
KR102395556B1 (ko) * 2014-12-18 2022-05-10 재단법인 포항산업과학연구원 오차의 정보량을 기반으로 한 모델의 입력 변수 선정 장치 및 방법
WO2017037768A1 (ja) * 2015-08-28 2017-03-09 株式会社日立製作所 評価システム、評価方法およびデータ解析システム
CN107832935B (zh) * 2017-10-30 2022-04-05 中国水利水电科学研究院 一种水文变量设计值的确定方法及装置
US11615100B2 (en) * 2018-06-28 2023-03-28 Sony Corporation Information processing apparatus, information processing method, and computer program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269215A (ja) * 2007-04-19 2008-11-06 Nippon Telegr & Teleph Corp <Ntt> 特異パターン検出システム、モデル学習装置、特異パターン検出方法、及び、コンピュータプログラム
JP2009284304A (ja) 2008-05-23 2009-12-03 Fujitsu Ltd 光通信装置および光通信システム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6469654B1 (en) * 2000-05-09 2002-10-22 Advanced Navigation & Positioning Corp. Transponder landing system
US6928398B1 (en) 2000-11-09 2005-08-09 Spss, Inc. System and method for building a time series model
CN1202240C (zh) * 2001-10-11 2005-05-18 华中农业大学 一种根瘤菌浓缩液体菌剂的制备方法
JP2004258991A (ja) * 2003-02-26 2004-09-16 Nec Corp Edr方向推定方法、システム、プログラム、及び記録媒体
US7436810B2 (en) * 2005-02-23 2008-10-14 Honeywell International Inc. Determination of wireless link quality for routing as a function of predicted delivery ratio
US20130324431A1 (en) * 2010-06-24 2013-12-05 Baylor College Of Medicine Olfactory receptor copy number association with age at onset of alzheimer's disease

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269215A (ja) * 2007-04-19 2008-11-06 Nippon Telegr & Teleph Corp <Ntt> 特異パターン検出システム、モデル学習装置、特異パターン検出方法、及び、コンピュータプログラム
JP2009284304A (ja) 2008-05-23 2009-12-03 Fujitsu Ltd 光通信装置および光通信システム

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KEITA KINJO: "Kino Suiron ni yoru Jikeiretsu Data kara no Kankei Kozo no Chushutsu", JOURNAL OF JAPAN SOCIETY FOR FUZZY THEORY AND INTELLIGENT INFORMATICS, vol. 21, no. 4, 15 August 2009 (2009-08-15), pages 587 - 597, XP008167842 *
NAOHIRO TODA: "Beki Kumiawase Takoshiki Kaiki Model to sono Keisu Suitei Seido", THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. J72-A, no. 10, 25 October 1989 (1989-10-25), pages 1556 - 1562, XP008167790 *
S. KONISHI; G. KITAGAWA: "Information Criterion, Series; Science of Prediction and Discovery", 25 September 2004, ASAKURA PUBLISHING CO., LTD., pages: 16 - 22,35-37
S. MORISHITA; S. MIYANO: "bit, separate volume; Discovery and Data Mining", 5 May 2000, KYORITSU SHUPPAN CO., LTD., pages: 159 - 168
See also references of EP2515260A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019197267A (ja) * 2018-05-07 2019-11-14 株式会社日立製作所 データ不足提示システムおよびデータ不足提示方法
JP7065685B2 (ja) 2018-05-07 2022-05-12 株式会社日立製作所 データ不足提示システムおよびデータ不足提示方法

Also Published As

Publication number Publication date
EP2515260A4 (en) 2018-01-10
US9104641B2 (en) 2015-08-11
JPWO2011074509A1 (ja) 2013-04-25
US20120331024A1 (en) 2012-12-27
EP2515260A1 (en) 2012-10-24
JP5692091B2 (ja) 2015-04-01
CN102656581B (zh) 2016-03-16
CN102656581A (zh) 2012-09-05
KR101303417B1 (ko) 2013-09-05
KR20120093363A (ko) 2012-08-22

Similar Documents

Publication Publication Date Title
JP5692091B2 (ja) 情報処理装置、情報処理方法およびコンピュータプログラム
CN109283562B (zh) 一种车联网中车辆三维定位方法及装置
Fernández-Prades et al. Bayesian nonlinear filtering using quadrature and cubature rules applied to sensor data fusion for positioning
US11860302B2 (en) Apparatus and method for characterizing an object based on measurement samples from one or more location sensors
US20140257700A1 (en) System and method for estimating uncertainty for geophysical gridding routines lacking inherent uncertainty estimation
Guerrier et al. Automatic identification and calibration of stochastic parameters in inertial sensors
Liu et al. Robust state and protection-level estimation within tightly coupled GNSS/INS navigation system
EP3351959B1 (en) Apparatus and method for performing a consistency testing using non-linear filters that provide predictive probability density functions
Alaeiyan et al. Hybrid noise removal to improve the accuracy of inertial sensors using lifting wavelet transform optimized by genetic algorithm
Zhang et al. An efficient tuning framework for Kalman filter parameter optimization using design of experiments and genetic algorithms
US9733341B1 (en) System and method for covariance fidelity assessment
CN110442142B (zh) 速度数据处理方法、装置、电子设备及计算机可读介质
Wang et al. A novel robust iterated CKF for GNSS/SINS integrated navigation applications
US20160223675A1 (en) Mobile terminal, position identification method, and position identification device
JP4882544B2 (ja) 追尾処理装置及びその方法並びにプログラム
Havyarimana et al. A Hybrid Approach‐Based Sparse Gaussian Kernel Model for Vehicle State Determination during Outage‐Free and Complete‐Outage GPS Periods
JP6610898B2 (ja) 横メタセンタ高さ推定装置及び横メタセンタ高さ推定方法
EP3654065B1 (en) Apparatus and method for characterizing an object based on measurement samples from one or more location sensors
Zaron Recent developments in bottom topography mapping using inverse methods
Jiang et al. Multi-objective optimal input design for grey-box identification modelling of ship manoeuvring motion
Stepanov et al. A Procedure of Comparative Analysis of Recursive Nonlinear Filtering Algorithms in Navigation Data Processing Based on Predictive Simulation
JP7491065B2 (ja) 状態推定装置、及び状態推定方法、状態推定プログラム
Shi et al. The clock-aided RAIM method and it's application in improving the positioning precision of GPS receiver
Yun Sequential Monte Carlo filtering with Gaussian mixture models for highly nonlinear systems
JP2006153736A (ja) 目標追尾装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080056544.X

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10837535

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011546098

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2010837535

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13515554

Country of ref document: US

ENP Entry into the national phase

Ref document number: 20127015349

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE