JP2006084630A - Infant's voice analysis system - Google Patents

Infant's voice analysis system Download PDF

Info

Publication number
JP2006084630A
JP2006084630A JP2004267979A JP2004267979A JP2006084630A JP 2006084630 A JP2006084630 A JP 2006084630A JP 2004267979 A JP2004267979 A JP 2004267979A JP 2004267979 A JP2004267979 A JP 2004267979A JP 2006084630 A JP2006084630 A JP 2006084630A
Authority
JP
Japan
Prior art keywords
crying
cause
infant
frequency
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004267979A
Other languages
Japanese (ja)
Inventor
Kaoru Arakawa
薫 荒川
Masaharu Inoue
雅晴 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Combi Corp
Meiji University
Original Assignee
Combi Corp
Meiji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Combi Corp, Meiji University filed Critical Combi Corp
Priority to JP2004267979A priority Critical patent/JP2006084630A/en
Publication of JP2006084630A publication Critical patent/JP2006084630A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To understand the reason why an infant is crying from the crying voice of the infant. <P>SOLUTION: An inputted speech signal is subjected to frequency analysis to find the frequency spectrum of the speech signal and it is estimated why the infant is crying is "sleepiness" when degrees q1, q2, q3, and q4 of variations between adjacent frequency bands among frequency bands obtained by dividing the found frequency spectrum are larger than a predetermined threshold or "hunger" when the degrees of variations between adjacent frequency bands are smaller than the predetermined threshold. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

この発明は、乳幼児の泣き声を解析して乳幼児の心理状態を推定し、それを表示する乳幼児の音声解析システムに関し、特に「眠い」と「空腹」の推定精度を向上させた乳幼児の音声解析システムに関する。   The present invention relates to an infant voice analysis system that analyzes and displays an infant's crying voice and displays the psychological state of the infant, and more particularly to an infant voice analysis system that improves the estimation accuracy of "sleepy" and "hungry". About.

乳幼児の泣き声から乳幼児の啼泣原因を把握する音声解析システムとして、従来、特許文献1に開示されたものが知られている。このシステムは、乳幼児の一呼吸分の音声信号を周波数解析して、音声信号の周波数スペクトルに基づく特徴量を算出し、この算出された特徴量に基づいて乳幼児の啼泣原因を推定するもので、音声信号の周波数スペクトルの各帯域の周期性の有無及び周期性のある周波数帯域に基づいて前記啼泣原因を推定している。より具体的には、例えば啼泣原因推定手段は、音声信号の周波数スペクトルが低周波帯から高周波帯まで連続的に周期性を有する場合、啼泣原因が「空腹」であると推定し、音声信号の周波数スペクトルが低い周波数帯で連続的に周期性を有する場合、啼泣原因が「眠い」であると推定し、音声信号の周波数スペクトルが周期性を有さず、又はその周期が時間的に変化する場合、啼泣原因が「痛い」であると推定する。
特開2002−2785582 段落0013〜0018、図1、図4
Conventionally, what is disclosed in Patent Document 1 is known as a voice analysis system for grasping the cause of crying of an infant from the cry of the infant. This system performs frequency analysis of an audio signal for one breath of an infant, calculates a feature value based on the frequency spectrum of the audio signal, and estimates the cause of the infant's crying based on the calculated feature value. The cause of the crying is estimated based on the presence / absence of periodicity in each band of the frequency spectrum of the audio signal and the frequency band with periodicity. More specifically, for example, when the frequency spectrum of the audio signal has a periodicity from a low frequency band to a high frequency band, the crying cause estimation unit estimates that the cause of crying is “hungry” If the frequency spectrum has periodicity in a low frequency band, it is estimated that the cause of crying is “sleepy”, and the frequency spectrum of the audio signal does not have periodicity, or the period changes over time In this case, the cause of crying is estimated to be “painful”.
Japanese Patent Laid-Open No. 2002-2785582, paragraphs 0013 to 0018, FIGS.

上述した従来の啼泣原因の推定方法では、乳幼児の一呼吸分の泣き声の周波数スペクトルを時間軸方向に並べて二次元空間に表示したときに現れる横縞状のパターンがどの程度高い周波数帯まで検出できるかによって、「空腹」か「眠い」かを判別するようにしている。   In the above-described conventional method for estimating the cause of crying, how high the frequency band of the horizontal stripe pattern that appears when the frequency spectrum of the crying voice for one breath of an infant is displayed in a two-dimensional space can be detected. Is used to discriminate between “hungry” and “sleepy”.

しかしながら、泣き声データによっては、上述した縞成分が不明瞭な場合が多く、空腹時でも高い周波数帯で縞成分の検出が困難な場合があった。   However, depending on the cry data, the above-described fringe component is often unclear, and it may be difficult to detect the fringe component in a high frequency band even when hungry.

この発明は、このような点に鑑みなされたもので、乳幼児の泣き声から乳幼児の啼泣原因をより精度良く把握することを可能にする乳幼児の音声解析システムを提供することを目的とする。   This invention is made in view of such a point, and it aims at providing the audio | voice analysis system of the infant which makes it possible to grasp | ascertain the cause of an infant's cry more accurately from the infant's cry.

本発明に係る乳幼児の音声解析システムは、乳幼児の音声信号を入力する入力手段と、前記入力された音声信号を周波数解析して前記音声信号の周波数スペクトルを求める音声解析手段と、前記周波数スペクトルを複数の周波数帯に分割したときの隣接する周波数帯間での変化の度合いが予め定めたしきい値よりも大きい場合には、啼泣原因が「眠い」であると推定し、前記隣接する周波数単位での変化の度合いが予め定めたしきい値よりも小さい場合には、啼泣原因が「空腹」であると推定する啼泣原因推定手段と、この啼泣原因推定手段で推定された啼泣原因を表示する表示手段とを備えたことを特徴とする。   An infant voice analysis system according to the present invention includes an input means for inputting a voice signal of an infant, a voice analysis means for obtaining a frequency spectrum of the voice signal by frequency analysis of the input voice signal, and the frequency spectrum. When the degree of change between adjacent frequency bands when dividing into a plurality of frequency bands is greater than a predetermined threshold, it is estimated that the cause of crying is "sleepy", and the adjacent frequency unit When the degree of change in the value is smaller than a predetermined threshold value, a cause of crying estimation that estimates that the cause of crying is “hungry” and a cause of crying estimated by the cause of crying estimation are displayed. And a display means.

前記啼泣原因推定手段は、好ましくは、解析の対象となる乳幼児の月齢毎の異なる複数の推定ルールを備え、推定ルール毎に、推定に使用される周波数帯としきい値が特定されている。   The crying cause estimation unit preferably includes a plurality of different estimation rules for each age of the infant to be analyzed, and a frequency band and a threshold value used for estimation are specified for each estimation rule.

例えば前記啼泣原因推定手段は、解析の対象となる乳幼児の年齢が3〜4ヶ月の場合には、前記周波数スペクトルにおける9kHz付近を中心としたその両側の周波数単位間での変化の度合いに着目し、解析の対象となる乳幼児の年齢が5〜12ヶ月の場合には、前記周波数スペクトルにおける3kHz付近を中心としたその両側の周波数単位間での変化の度合いに着目する。そして、着目した変化の度合いが前記所定のしきい値を超えるか超えないかで啼泣原因が「眠い」であるか「空腹」であるかを推定する。   For example, when the age of the infant to be analyzed is 3 to 4 months, the cause of crying cause estimation means pays attention to the degree of change between the frequency units on both sides of the frequency spectrum around 9 kHz. When the age of the infant to be analyzed is 5 to 12 months, attention is paid to the degree of change between the frequency units on both sides of the frequency spectrum centering around 3 kHz. Then, it is estimated whether the cause of crying is “sleepy” or “hungry”, based on whether or not the degree of change of interest exceeds or exceeds the predetermined threshold value.

また、前記啼泣原因推定手段は、望ましくは前記周波数帯の変化の度合いによる啼泣原因の推定処理に先立って、前記音声信号の周波数スペクトルの各帯域の周期性の有無を検出し、音声信号の周波数スペクトルが低周波帯から高周波帯まで連続的に周期性を有する場合、啼泣原因が「空腹」であると推定するものである。   Further, the crying cause estimation means preferably detects the presence or absence of periodicity in each band of the frequency spectrum of the audio signal prior to the estimation process of the cause of crying according to the degree of change in the frequency band, and the frequency of the audio signal When the spectrum has periodicity continuously from the low frequency band to the high frequency band, it is estimated that the cause of crying is “hunger”.

本発明によれば、乳幼児の音声信号の周波数スペクトルを複数の周波数帯に分割したときの隣接する周波数帯間での変化の度合いが、予め定めたしきい値よりも大きい場合には、啼泣原因が「眠い」であると推定し、隣接する周波数単位での変化の度合いが予め定めたしきい値よりも小さい場合には、啼泣原因が「空腹」であると推定しているので、周波数スペクトルの周期性に基づく縞成分を検出できない場合でも、「空腹」と「眠い」を識別することができ、乳幼児の啼泣原因をより精度良く推定することができる。   According to the present invention, if the degree of change between adjacent frequency bands when the frequency spectrum of the infant's audio signal is divided into a plurality of frequency bands is greater than a predetermined threshold, the cause of crying Is assumed to be “sleepy”, and if the degree of change in adjacent frequency units is smaller than a predetermined threshold, the cause of crying is estimated to be “hungry”, so the frequency spectrum Even when the fringe component based on the periodicity cannot be detected, “hungry” and “sleepy” can be distinguished, and the cause of crying of the infant can be estimated more accurately.

以下、図面を参照して、この発明の好ましい実施の形態について説明する。図1は、本発明の一実施例に係る乳幼児の音声解析システムの構成を示す機能ブロック図である。   Hereinafter, preferred embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a functional block diagram showing the configuration of an infant voice analysis system according to an embodiment of the present invention.

このシステムは、乳幼児の泣き声を音声信号として取り込むマイク1と、このマイク1で取り込んだ音声信号を所定のサンプリング周波数でサンプリングしてアナログ/ディジタル変換するA/D変換器2と、このA/D変換器2でサンプリングされた音声信号を解析して周波数スペクトルに基づく特徴量を算出する音声解析部3と、この音声解析部3で求められた音声信号の特徴量に基づいて啼泣原因を推定する啼泣原因推定部4と、この啼泣原因推定部4での推定結果を表示する推定結果表示部5とを備えて構成されている。   This system includes a microphone 1 that captures an infant's cry as an audio signal, an A / D converter 2 that samples the audio signal captured by the microphone 1 at a predetermined sampling frequency, and performs analog / digital conversion. A speech analysis unit 3 that analyzes the speech signal sampled by the converter 2 and calculates a feature amount based on the frequency spectrum, and estimates the cause of crying based on the feature amount of the speech signal obtained by the speech analysis unit 3 The crying cause estimation unit 4 and an estimation result display unit 5 that displays an estimation result in the crying cause estimation unit 4 are configured.

なお、このシステムは、ソフトウェア、ハードウェア又はその両方により実現されるもので、システムの設置場所に応じて、種々の形態を取りうる。例えば、(1)マイク1を乳幼児の近傍に設置し、そこで音声を採取して、他の場所に置かれた音声解析部3、啼泣原因推定部4及び推定結果表示部5に有線又は無線で音声信号を送り、他の場所で解析、推定及び表示を行う形態、(2)全体が乳幼児の近傍に設置される形態、(3)音声信号の採取、解析及び推定を乳幼児の近傍で行い、推定結果を他の場所に設置された推定結果表示部5に推定結果を表示する形態等が考えられるが、特にこれらの形態には限られない。   This system is realized by software, hardware, or both, and can take various forms depending on the installation location of the system. For example, (1) the microphone 1 is installed in the vicinity of an infant, the voice is collected there, and the voice analysis unit 3, the crying cause estimation unit 4 and the estimation result display unit 5 placed in another place are wired or wirelessly A form in which an audio signal is sent and analyzed, estimated and displayed in another place, (2) a form in which the whole is installed in the vicinity of the infant, (3) a voice signal is collected, analyzed and estimated in the vicinity of the infant, Although the form etc. which display an estimation result on the estimation result display part 5 installed in another place for an estimation result can be considered, it is not restricted to these forms in particular.

次に、具体的解析・推定の手法として、周波数解析により、空腹、眠い、痛いという三種類の状態を分類する方式の例について説明する。   Next, as a specific analysis / estimation method, an example of a method for classifying three types of states of hunger, sleepiness, and pain by frequency analysis will be described.

まず、乳幼児の泣き声をマイク1から取り込み、A/D変換器2でディジタル化する。この際、サンプリング周波数は、15kHz以上の周波数成分を見るため、折り返し雑音が入らないように30kHz以上、好ましくは40kHz以上(例えば44.1kHz等)と高めに設定することが望ましい。   First, an infant's cry is taken from the microphone 1 and digitized by the A / D converter 2. At this time, the sampling frequency is set to a high value of 30 kHz or more, preferably 40 kHz or more (for example, 44.1 kHz, etc.) so that aliasing noise does not enter in order to see frequency components of 15 kHz or more.

得られたディジタルデータを音声解析部3に供給する。音声解析部3は、啼泣原因推定部4と共に、パソコン、マイクロプロセッサ、DSP等の信号処理装置によって実現することができ、その機能として一呼吸切出し部31と周波数解析・特徴量算出部32とを含む。まず、一呼吸分の音声信号が切り出される。即ち、図2に示すように、乳幼児の泣き声は乳幼児の呼吸と連動して断続的に発生し、一呼吸分の有音部と無音部とが繰り返される信号となるので、一呼吸分切り出し部31は、ある程度の音圧レベルが連続する区間を一呼吸分の信号としてその区間毎に音声信号を切り出す。   The obtained digital data is supplied to the voice analysis unit 3. The voice analysis unit 3 can be realized by a signal processing device such as a personal computer, a microprocessor, a DSP and the like together with the crying cause estimation unit 4. As a function, the speech analysis unit 3 includes a breath extraction unit 31 and a frequency analysis / feature amount calculation unit 32. Including. First, an audio signal for one breath is cut out. That is, as shown in FIG. 2, since the infant's cry is intermittently generated in conjunction with the infant's breathing and becomes a signal in which the sound part and silence part for one breath are repeated, 31 cuts out an audio signal for each section, using a section in which a certain level of sound pressure level continues as a signal for one breath.

次に、周波数解析・特徴量算出部32は、図3に示すように、切り出された区間の音声信号からN箇所の小区間を所定の間隔で取り出して、これら小区間について、それぞれフーリエ変換を施して各小区間毎の周波数スペクトル(パワースペクトル)を求めると共に、その特徴量を算出する。なお、フーリエ変換方式としてはFFT(高速フーリエ変換)が一般的であるので、以下、これを使って説明するが、他の方式を用いても良いことはいうまでもない。   Next, as shown in FIG. 3, the frequency analysis / feature amount calculation unit 32 extracts N small sections from the audio signal of the extracted section at a predetermined interval, and performs Fourier transform on each of the small sections. To obtain a frequency spectrum (power spectrum) for each small section and to calculate the feature amount. Note that since FFT (Fast Fourier Transform) is generally used as the Fourier transform method, it will be described below using other methods, but it goes without saying that other methods may be used.

図4は、各時刻(N箇所)における周波数スペクトル(パワースペクトル)とこれを連続的に求めて、横軸に時間、縦軸に周波数をとって表示したサウンドスペクトグラムとを示す図である。乳幼児の啼泣原因としては、空腹、眠い、痛い、寂しい、怖い、不快等が挙げられるが、このうちここでは、空腹及び眠いに関して泣き声のサウンドスペクトグラムを求めると、次のようになる。   FIG. 4 is a diagram showing a frequency spectrum (power spectrum) at each time (N locations) and a sound spectrogram obtained by continuously obtaining the frequency spectrum and displaying the time on the horizontal axis and the frequency on the vertical axis. Causes of crying for infants include hunger, sleepiness, pain, loneliness, fear, discomfort, etc. Here, the sound spectrogram of crying regarding hunger and sleepiness is as follows.

(1)空腹時:一呼吸分の泣き声を切り出して、この切り出し区間内のN箇所の小区間に対してそれぞれ周波数スペクトルを求めると、得られるN個の周波数スペクトル(パワースペクトル)は、図4(a)のように、低い周波数から高い周波数まで周期的にピークが現れるほぼ同一の周期波形となる。従って、一呼吸分の泣き声に対し、サウンドスペクトグラムを求めると、横縞が低い周波数から高い周波数まで連続的に現れる。本発明者等の実験によると、空腹時の泣き声のサウンドスペクトグラムには、(a)15kHz以上で横縞が検出される場合、(b)11kHz以上で横縞が明瞭に検出される場合、(c)11kHz以上で横縞が僅かに検出され、且つ6〜10kHzまで連続して横縞が存在している場合がある。   (1) On an empty stomach: When crying for one breath is cut out and the frequency spectrum is obtained for each of the N subsections in the cutout section, the obtained N frequency spectra (power spectra) are shown in FIG. Like (a), it becomes the substantially same periodic waveform from which a peak appears periodically from a low frequency to a high frequency. Therefore, when a sound spectrogram is obtained for a cry for one breath, horizontal stripes appear continuously from a low frequency to a high frequency. According to the experiments by the present inventors, in the sound spectrum of the hungry cry, (a) when horizontal stripes are detected at 15 kHz or higher, (b) when horizontal stripes are clearly detected at 11 kHz or higher, (c ) Horizontal stripes are slightly detected at 11 kHz or more, and there may be continuous horizontal stripes from 6 to 10 kHz.

(2)眠いとき:一呼吸分の泣き声を切り出して、この切り出し区間内のN箇所の小区間に対してそれぞれ周波数スペクトルを求めると、得られるN個の周波数スペクトル(パワースペクトル)は、図4(b)のように、低い周波数帯(0〜6kHzくらい)でのみ周期的にピークが現れるほぼ同一の周期波形となる。従って、一呼吸分の泣き声のサウンドスペクトグラムでは、横縞が現れるが、これが低い周波数帯(0〜6kHzくらい)までしか現れない。   (2) When sleepy: When the cry for one breath is cut out and the frequency spectrum is obtained for each of the N subsections in the cutout section, the obtained N frequency spectra (power spectra) are shown in FIG. As shown in (b), the waveforms are substantially the same in which peaks periodically appear only in a low frequency band (about 0 to 6 kHz). Therefore, in the sound spectrogram of the cry for one breath, a horizontal stripe appears, but this appears only up to a low frequency band (about 0 to 6 kHz).

なお、以上は、泣き声のサウンドスペクトグラムに現れる横縞から「空腹」及び「眠いとき」を識別するようにしているが、泣き声のデータの中には、縞成分が不明瞭なデータも多い。そこで、このシステムでは、縞成分の検出ができない場合でも、もう一つの推定方法を併用することによって、「空腹」と「眠いとき」の識別精度を向上させる。具体的には、周波数スペクトルの大きさの変化の仕方(急激な減少があるかどうか)に着目する。   In the above, “hungry” and “when sleepy” are identified from the horizontal stripes appearing in the sound spectrogram of the cry, but there are many pieces of data in which the stripe component is unclear in the cry data. Therefore, in this system, even when the fringe component cannot be detected, the accuracy of discrimination between “hungry” and “when sleepy” is improved by using another estimation method in combination. Specifically, attention is focused on how the magnitude of the frequency spectrum changes (whether there is a sudden decrease).

すなわち、図5に示すように、周波数スペクトルを周波数軸方向に複数の周波数帯に分割する。ここでは、3kHz毎に分割し、0〜3kHz、3〜6kHz、6〜9kHz、9〜12kHz、12kHz〜をそれぞれ周波数帯F1,F2,F3,F4,F5としている。いま、周波数帯Fiのスペクトル│X(f)│の積分値をSiとすると、qiを次のように定義する。   That is, as shown in FIG. 5, the frequency spectrum is divided into a plurality of frequency bands in the frequency axis direction. Here, it is divided every 3 kHz, and 0 to 3 kHz, 3 to 6 kHz, 6 to 9 kHz, 9 to 12 kHz, and 12 kHz are set as frequency bands F1, F2, F3, F4, and F5, respectively. Now, assuming that the integral value of the spectrum | X (f) | of the frequency band Fi is Si, qi is defined as follows.

[数1]
qi=Si/Si+1
このqiは、隣接する周波数帯Fi、Fi+1の変化の度合いを示した特徴量である。
[Equation 1]
qi = Si / Si + 1
This qi is a feature amount indicating the degree of change between adjacent frequency bands Fi and Fi + 1.

図6は、月齢が3〜4ヶ月の乳幼児の空腹時及び眠いときの隣接周波数帯の変化の度合いq1,q2,q3,q4を示し、図7は、月齢が5〜12ヶ月の乳幼児の空腹時及び眠いときの隣接周波数帯の変化の度合いq1,q2,q3,q4を示している。これらの図から明らかなように、3〜4ヶ月の乳幼児については、q3が空腹時に5.9、眠いときに8.4と高い数値を示し、q1,q2,q4については、2.1〜2.9と低い数値を示していた。これは、9kHzを中心に周波数スペクトルの値が急激に低下していることを示し、眠いときは空腹時よりもより低下の程度が大きいことを示している。この傾向は、月齢によって異なり、5〜12ヶ月の乳幼児については、q1が空腹時に6.5、眠いときに8.9と高い数値を示し、q2,q3,q4については、2.4〜3.8と低い数値を示していた。これは、3kHzを中心に周波数スペクトルの値が急激に低下していることを示し、眠いときは空腹時よりもより低下の程度が大きいことを示している。   FIG. 6 shows the degree of change q1, q2, q3, q4 of the adjacent frequency bands when the infant is 3-4 months old when hungry and sleepy, and FIG. 7 shows the hungry state of the infant 5-5 months old. The degree q1, q2, q3, q4 of the change of the adjacent frequency band at the time of sleep and sleep is shown. As is clear from these figures, for infants 3 to 4 months old, q3 shows a high value of 5.9 when hungry and 8.4 when sleepy, and q1, q2, and q4 show 2.1 to The value was as low as 2.9. This indicates that the value of the frequency spectrum is drastically decreasing centering on 9 kHz, and indicates that the degree of decrease is greater when sleepy than when hungry. This tendency varies depending on the age, and for infants 5 to 12 months, q1 is as high as 6.5 when hungry and 8.9 when sleepy, and 2.4 to 3 for q2, q3, and q4 .8, a low value. This indicates that the value of the frequency spectrum is drastically decreasing around 3 kHz, and that the degree of decrease is greater when sleepy than when fasting.

以上のことから、月齢3〜4ヶ月の乳幼児については、例えばq3,q4について、また、月齢5〜12ヶ月の乳幼児については、q1,q2について、それぞれの空腹時の数値と眠いときの数値の間の数値をしきい値T1,T2としてそれぞれ設定すれば、「空腹」状態と「眠い」状態とを識別することができる。   From the above, for infants 3 to 4 months of age, for example, q3 and q4, and for infants 5 to 12 months of age, q1 and q2, the values for fasting and sleepy If the numerical values between them are set as threshold values T1 and T2, respectively, the “hungry” state and the “sleepy” state can be distinguished.

なお、図6及び図7の数値は、あくまで平均値であり、実際のサンプルでは、ある程度のバラツキが観測された。上述した横縞パターンの検出との併用を考慮すれば、実際には横縞パターンによる検出が不能であったサンプルについて隣接周波数帯の変化の度合いを考慮すればよく、本発明者等の行った実験では、5〜12ヶ月の乳幼児については、T1=6、T2=3に設定した場合が最も検出精度が高かった。   Note that the numerical values in FIGS. 6 and 7 are only average values, and some variation was observed in the actual samples. In consideration of the combined use with the detection of the horizontal stripe pattern described above, it is sufficient to consider the degree of change in the adjacent frequency band for the sample that could not be detected by the horizontal stripe pattern in practice. For infants 5 to 12 months old, the detection accuracy was highest when T1 = 6 and T2 = 3.

また、「空腹」時の泣き声サウンドスペクトルと、「眠い」ときの泣き声サウンドスペクトルのもう一つ異なる点は、低周波領域の振幅である。すなわち、空腹時の音量は、眠いときの音量よりも大きいことが多い。従って、この点についても予備的な判断要素とする。   Another difference between the cry sound spectrum when “hungry” and the cry sound spectrum when “sleepy” is the amplitude in the low frequency region. That is, the volume on an empty stomach is often higher than the volume on a sleepy day. Therefore, this point is also a preliminary determination factor.

以上の点を踏まえ、周波数解析・特徴量算出部32では、特徴量として、以下のようなものを算出する。
a)N箇所のFFTで得られるN個のパワースペクトル値。
b)N個のパワースペクトルの各周波数帯における分散値。
c)各パワースペクトルについて各周波数帯域毎に求めたケプストラム。
d)パワースペクトルで周期性が検出されたものに対する各ピークの箇所。
Based on the above points, the frequency analysis / feature amount calculation unit 32 calculates the following as the feature amount.
a) N power spectrum values obtained by FFT at N locations.
b) Dispersion value in each frequency band of N power spectra.
c) Cepstrum obtained for each frequency band for each power spectrum.
d) The location of each peak for the periodicity detected in the power spectrum.

次に、啼泣原因推定部4では、音声解析部3で算出された特徴量から乳幼児の啼泣原因を推定する。即ち、空腹、眠いの二種類に対し、上述した特徴を考慮したルールを作り、それに基づいて啼泣原因の推定を行う。   Next, the crying cause estimation unit 4 estimates the cause of crying of the infant from the feature amount calculated by the voice analysis unit 3. That is, for the two types of hungry and sleepy, a rule considering the above-mentioned characteristics is created, and the cause of crying is estimated based on the rule.

図8は、5〜12ヶ月の乳幼児の泣き声分析に使用される推定処理のフローチャートである。   FIG. 8 is a flowchart of an estimation process used for analyzing a crying voice of an infant of 5 to 12 months.

まず、泣き声のサウンドスペクトグラムに現れる横縞パターンを検出する。すなわち、15kHz以上で横縞が検出される場合(S1)、11kHz以上で横縞が明瞭に検出される場合(S2)、11kHz以上で横縞が僅かに検出され、且つ6〜10kHzまで連続して横縞が存在している場合(S3)には、推定結果を「空腹」とする。また、ステップS1〜S3がいずれもNOである場合には、隣接周波数帯の変化の度合いq1,q2がそれぞれしきい値T1,T2より小さいかどうか、更に低周波数帯F1のレベルが、しきい値T3より大きいかどうかを調べ(S4)、これらを全て満足する場合には、推定結果を「空腹」とする。またステップS4のいずれか1つの条件を満足しない場合には、推定結果を「眠い」とする。   First, the horizontal stripe pattern that appears in the sound spectrogram of the cry is detected. That is, when horizontal stripes are detected at 15 kHz or higher (S1), when horizontal stripes are clearly detected at 11 kHz or higher (S2), horizontal stripes are slightly detected at 11 kHz or higher, and horizontal stripes continuously from 6 to 10 kHz. If it exists (S3), the estimation result is “hungry”. Further, when all of steps S1 to S3 are NO, whether or not the degree of change q1 and q2 of the adjacent frequency band is smaller than the threshold values T1 and T2, respectively, and the level of the low frequency band F1 is the threshold. It is checked whether or not it is larger than the value T3 (S4), and when all of these are satisfied, the estimation result is set to “hungry”. If any one of the conditions in step S4 is not satisfied, the estimation result is “sleepy”.

なお、以上は月齢5〜12ヶ月の乳幼児の泣き声の推定ルールであり、月齢の異なる乳幼児に対する推定ルールは、月齢毎に別途用意しておく必要がある。   In addition, the above is the estimation rule of the cry of 5-12 months old infants, and the estimation rule with respect to infants with different ages needs to be prepared separately for each age.

そして、これらの推定結果は、推定結果表示部5において文字、画像、光、音声等で表示される。これにより、特に乳幼児から離れた位置で表示部5をモニタしている育児担当者に対して、その啼泣の事実及びその原因の両方を報知することができるので、極めて効果的な育児支援を行うことができる。   These estimation results are displayed in the estimation result display unit 5 as characters, images, light, voice, and the like. Thereby, since it is possible to notify both the fact of the crying and the cause thereof to a childcare person who monitors the display unit 5 at a position apart from the infant, the childcare support is extremely effective. be able to.

なお、以上の実施形態では「空腹」と「眠い」について説明したが、「痛み」及び「甘え」についても、同様の基準により識別可能である。   In the above embodiment, “hungry” and “sleepy” have been described, but “pain” and “sweet” can also be identified by the same criteria.

本発明の一実施形態に係る乳幼児の音声解析システムのブロック図である。1 is a block diagram of an infant voice analysis system according to an embodiment of the present invention. 同システムに入力される乳幼児の啼泣時の音声信号及びその切り出し方法を示す波形図である。It is a wave form diagram which shows the audio | voice signal at the time of crying of the infant input into the system, and its cutting-out method. 同システムにおける連続するFFTを説明するための図である。It is a figure for demonstrating the continuous FFT in the same system. 同システムで観測される啼泣原因別のパワースペクトルとサウンドスペクトグラムを示すグラフである。It is a graph which shows the power spectrum and sound spectrogram according to the cause of crying observed with the system. 泣き声音声信号の周波数スペクトラムを示すグラフである。It is a graph which shows the frequency spectrum of a cry voice signal. 同周波数スペクトラムの隣接周波数帯の変化の度合いを周波数毎、啼泣原因毎に示した表である。It is the table | surface which showed the degree of the change of the adjacent frequency band of the same frequency spectrum for every frequency and every cause of crying. 同周波数スペクトラムの隣接周波数帯の変化の度合いを周波数毎、啼泣原因毎に示した表である。It is the table | surface which showed the degree of the change of the adjacent frequency band of the same frequency spectrum for every frequency and every cause of crying. 同システムにおける啼泣原因推定部の処理を示すフローチャートである。It is a flowchart which shows the process of the crying cause estimation part in the same system.

符号の説明Explanation of symbols

1…マイク、2…A/D変換器、3…音声解析部、4…啼泣原因推定部、5…推定結果表示部、31…一呼吸分切出し部、32…周波数解析・特徴量算出部。   DESCRIPTION OF SYMBOLS 1 ... Microphone, 2 ... A / D converter, 3 ... Speech analysis part, 4 ... Crying cause estimation part, 5 ... Estimation result display part, 31 ... Extraction part for one breath, 32 ... Frequency analysis and feature-value calculation part

Claims (5)

乳幼児の音声信号を入力する入力手段と、
前記入力された音声信号を周波数解析して前記音声信号の周波数スペクトルを求める音声解析手段と、
前記周波数スペクトルを複数の周波数帯に分割したときの隣接する周波数帯間での変化の度合いが予め定めたしきい値よりも大きい場合には、啼泣原因が「眠い」であると推定し、前記隣接する周波数単位での変化の度合いが予め定めたしきい値よりも小さい場合には、啼泣原因が「空腹」であると推定する啼泣原因推定手段と、
この啼泣原因推定手段で推定された啼泣原因を表示する表示手段と
を備えたことを特徴とする乳幼児の音声解析システム。
An input means for inputting an infant's voice signal;
A voice analysis means for analyzing the frequency of the input voice signal to obtain a frequency spectrum of the voice signal;
When the degree of change between adjacent frequency bands when dividing the frequency spectrum into a plurality of frequency bands is greater than a predetermined threshold, it is estimated that the cause of crying is "sleepy", When the degree of change in adjacent frequency units is smaller than a predetermined threshold value, crying cause estimation means for estimating that the cause of crying is “hungry”;
An infant voice analysis system comprising: display means for displaying a cause of crying estimated by the cause of crying estimation.
前記啼泣原因推定手段は、解析の対象となる乳幼児の月齢毎の異なる複数の推定ルールを備え、推定ルール毎に、推定に使用される周波数帯としきい値が特定されている
ことを特徴とする請求項1記載の音声解析システム。
The crying cause estimation means includes a plurality of different estimation rules for each age of infant to be analyzed, and a frequency band and a threshold value used for estimation are specified for each estimation rule. The speech analysis system according to claim 1.
前記啼泣原因推定手段は、解析の対象となる乳幼児の年齢が3〜4ヶ月の場合には、前記周波数スペクトルにおける9kHz付近を中心としたその両側の周波数単位間での変化の度合いが前記所定のしきい値を超えるか超えないかで啼泣原因が「眠い」であるか「空腹」であるかを推定するものであることを特徴とする請求項1記載の乳幼児の音声解析システム。   When the age of the infant to be analyzed is 3 to 4 months, the crying cause estimation means determines the degree of change between the frequency units on both sides of the frequency spectrum centered around 9 kHz. The infant voice analysis system according to claim 1, wherein whether the cause of crying is "sleepy" or "hungry" is estimated based on whether the threshold value is exceeded or not exceeded. 前記啼泣原因推定手段は、解析の対象となる乳幼児の年齢が5〜12ヶ月の場合には、前記周波数スペクトルにおける3kHz付近を中心としたその両側の周波数単位間での変化の度合いが前記所定のしきい値を超えるか超えないかで啼泣原因が「眠い」であるか「空腹」であるかを推定するものであることを特徴とする請求項1記載の乳幼児の音声解析システム。   When the age of the infant to be analyzed is 5 to 12 months, the crying cause estimation means determines the degree of change between the frequency units on both sides of the frequency spectrum centering around 3 kHz. The infant voice analysis system according to claim 1, wherein whether the cause of crying is "sleepy" or "hungry" is estimated based on whether the threshold value is exceeded or not exceeded. 前記啼泣原因推定手段は、前記周波数帯の変化の度合いによる啼泣原因の推定処理に先立って、前記音声信号の周波数スペクトルの各帯域の周期性の有無を検出し、音声信号の周波数スペクトルが低周波帯から高周波帯まで連続的に周期性を有する場合、啼泣原因が「空腹」であると推定する
ことを特徴とする請求項1記載の乳幼児の音声解析システム。
The crying cause estimation means detects the presence or absence of periodicity in each band of the frequency spectrum of the voice signal prior to the estimation process of the cause of crying according to the degree of change in the frequency band, and the frequency spectrum of the voice signal is low frequency. The infant voice analysis system according to claim 1, wherein the cause of crying is estimated to be “hunger” when the band has periodicity continuously from the band to the high frequency band.
JP2004267979A 2004-09-15 2004-09-15 Infant's voice analysis system Pending JP2006084630A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004267979A JP2006084630A (en) 2004-09-15 2004-09-15 Infant's voice analysis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004267979A JP2006084630A (en) 2004-09-15 2004-09-15 Infant's voice analysis system

Publications (1)

Publication Number Publication Date
JP2006084630A true JP2006084630A (en) 2006-03-30

Family

ID=36163215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004267979A Pending JP2006084630A (en) 2004-09-15 2004-09-15 Infant's voice analysis system

Country Status (1)

Country Link
JP (1) JP2006084630A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035664A1 (en) * 2016-08-22 2018-03-01 衣佳鑫 Method and system for detecting sucking times of infant based on audio frequency
CN109065034A (en) * 2018-09-25 2018-12-21 河南理工大学 A kind of vagitus interpretation method based on sound characteristic identification
JP2019095931A (en) * 2017-11-20 2019-06-20 ユニ・チャーム株式会社 Program and method for supporting childcare

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278582A (en) * 2001-03-22 2002-09-27 Meiji Univ Analysis system for baby's voice
JP2004181218A (en) * 2002-11-21 2004-07-02 Seiko Instruments Inc Monitoring system and monitoring method for infants' circumstances
JP2005352154A (en) * 2004-06-10 2005-12-22 National Institute Of Information & Communication Technology Device of reactively operating to feeling condition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002278582A (en) * 2001-03-22 2002-09-27 Meiji Univ Analysis system for baby's voice
JP2004181218A (en) * 2002-11-21 2004-07-02 Seiko Instruments Inc Monitoring system and monitoring method for infants' circumstances
JP2005352154A (en) * 2004-06-10 2005-12-22 National Institute Of Information & Communication Technology Device of reactively operating to feeling condition

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035664A1 (en) * 2016-08-22 2018-03-01 衣佳鑫 Method and system for detecting sucking times of infant based on audio frequency
JP2019095931A (en) * 2017-11-20 2019-06-20 ユニ・チャーム株式会社 Program and method for supporting childcare
JP7246851B2 (en) 2017-11-20 2023-03-28 ユニ・チャーム株式会社 Program, childcare support method, and childcare support system
CN109065034A (en) * 2018-09-25 2018-12-21 河南理工大学 A kind of vagitus interpretation method based on sound characteristic identification
CN109065034B (en) * 2018-09-25 2023-09-08 河南理工大学 Infant crying translation method based on voice feature recognition

Similar Documents

Publication Publication Date Title
JP3564501B2 (en) Infant voice analysis system
US9307950B2 (en) Sleep apnea syndrome testing apparatus, test method for sleep apnea syndrome and tangible recording medium recording program
EP1901281B1 (en) Speech analyzer detecting pitch frequency, speech analyzing method, and speech analyzing program
US8050910B2 (en) Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency
JP6136394B2 (en) Respiratory sound analyzer, respiratory sound analysis method and respiratory sound analysis program
JP3151489B2 (en) Apparatus for detecting fatigue and dozing by sound and recording medium
EP3165164A1 (en) Respiratory sound analysis device, respiratory sound analysis method, computer program, and recording medium
US10667761B2 (en) Real time audification of neonatal electroencephalogram (EEG) signals
Selamtzis et al. Effect of vowel context in cepstral and entropy analysis of pathological voices
KR101635899B1 (en) Method for determining state of breathing during sleep
KR102043972B1 (en) Apparatus for extraction acoustic parameter in aspirated voice of stroke patients and method thereof
JP2006084630A (en) Infant&#39;s voice analysis system
JP6056527B2 (en) Intruder detection device
JP4926588B2 (en) Insulation discharge sound discrimination method and apparatus
JP6467044B2 (en) Shunt sound analysis device, shunt sound analysis method, computer program, and recording medium
JP6036178B2 (en) Respiratory sound analyzer, respiratory sound analysis method and respiratory sound analysis program
JP2012024527A (en) Device for determining proficiency level of abdominal breathing
KR20140119920A (en) Emotion classifying system for using wireless bio-signal mesure device
JP6501917B2 (en) Body sound analysis device, body sound analysis method, computer program and recording medium
JP6531187B2 (en) Body sound analysis device, body sound analysis method, computer program and recording medium
JP2000276463A (en) Method and device for data analysis and recording medium for recording data analysis processing program
JP2007244478A (en) Pulse wave detector and method of detecting pulse wave
JP6298527B2 (en) Body sound analysis apparatus, body sound analysis method, computer program, and recording medium
JP4344262B2 (en) Acoustic information presentation apparatus and method
JP3780273B2 (en) Body reaction information detection system while sleeping

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070911

A521 Written amendment

Effective date: 20071017

Free format text: JAPANESE INTERMEDIATE CODE: A523

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20071017

A521 Written amendment

Effective date: 20071017

Free format text: JAPANESE INTERMEDIATE CODE: A821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101130