WO1994024667A1 - Apparatus for recording and reproducing voice - Google Patents

Apparatus for recording and reproducing voice Download PDF

Info

Publication number
WO1994024667A1
WO1994024667A1 PCT/JP1994/000661 JP9400661W WO9424667A1 WO 1994024667 A1 WO1994024667 A1 WO 1994024667A1 JP 9400661 W JP9400661 W JP 9400661W WO 9424667 A1 WO9424667 A1 WO 9424667A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
signal
data
reproducing
part display
Prior art date
Application number
PCT/JP1994/000661
Other languages
English (en)
French (fr)
Inventor
Hiromu Ishibashi
Original Assignee
Kabushiki Kaisya Advance
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kabushiki Kaisya Advance filed Critical Kabushiki Kaisya Advance
Priority to EP94913792A priority Critical patent/EP0652560A4/en
Publication of WO1994024667A1 publication Critical patent/WO1994024667A1/ja
Priority to KR1019940704661A priority patent/KR950702323A/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/04Electrically-operated educational appliances with audible presentation of the material to be studied
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/218Write-once discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2545CDs

Definitions

  • the present invention relates to an audio recording / reproducing device, and more particularly to an audio reproducing device such as a learning / education device or an audio electronic book.
  • An object of the present invention is to solve the above-mentioned problems of the prior art, to store a sufficient amount of audio data in a predetermined recording medium and to obtain an audio output close to natural reading aloud for a long time during reproduction.
  • a playback device is provided. Disclosure of the invention
  • an audio recording / reproducing apparatus basically has the following technical configuration.
  • Voice signal storage means for converting a non-voice portion included in the voice signal into a predetermined non-voice portion display data overnight signal and storing the voice signal; voice reproduction means for reproducing the stored voice signal at a desired utterance speed; More specifically, a voiceless part display converting means for converting a voiceless part included in an input voice signal into a predetermined voiceless part display data signal; Storage means for storing an input audio signal including the non-audio partial display data signal converted by the partial display conversion means, and more specifically, A non-sound portion display conversion means for converting the included no-sound portion into a predetermined no-sound portion display data signal; and the no-sound portion display data signal converted by the no-sound portion display conversion means.
  • Storage means for storing including input audio signal, and an audio recording and reproducing apparatus which consists of a sound reproducing means for reproducing the input audio signal stored in the storage means at a desired speech rate.
  • digital audio data is stored in a storage medium in a form in which substantially no audio portions are deleted, and the non-audio time is added at the time of reproduction, so that the audio data can be stored.
  • the medium can store sufficient audio data, and this silent time is added during playback, so that a long-term audio output similar to natural reading can be obtained.
  • FIG. 1 is a diagram showing an embodiment of the recording means of the present invention.
  • FIG. 2 is a diagram showing an embodiment of the reproducing means of the present invention.
  • FIGS. 3 (A), 3 (B), 4 (A), and 4 (B) are diagrams for explaining an embodiment of the present invention.
  • FIGS. 5A and 5B are diagrams showing an example of a method for identifying the length of a silent part in the present invention.
  • FIG. 6 is a diagram showing another embodiment of the present invention.
  • FIG. 7 is a flowchart specifically showing the non-speech processing unit shown in FIG.
  • FIGS. 8 (A) and 8 (B) are diagrams showing another example of a signal example in a case where a silent part is substantially deleted.
  • FIG. 9 is a block diagram showing a configuration of another embodiment of the present invention.
  • FIG. 10 is a flowchart for performing the determination of the silent part in the present invention.
  • FIGS. 11 to 12 are flowcharts showing the operation procedure for executing the silent part deleting method in another specific example of the present invention shown in FIG.
  • FIGS. 13 (A) to 13 (C) are diagrams illustrating an example of determining the brass / minus component mode in the present invention.
  • FIG. 14 is a flowchart for explaining the operation procedure of the rearrangement means in the specific example of FIG. 9 according to the present invention.
  • FIG. 15 is a waveform diagram showing an example of an audio input signal used in the present invention.
  • FIG. 1 is a block diagram schematically showing the configuration of a specific example of the recording means 100 of the input audio signal in the audio recording / reproducing apparatus according to the present invention.
  • a recording means 100 is shown, which comprises a storage means 11 for storing an input audio signal including the input audio signal.
  • (11) is a recording medium, which is mainly composed of a digital storage medium such as an optical disk, a magneto-optical disk, and a magnetic disk.
  • (111) is a writing means, which comprises a writing head, a head driving driver, and the like.
  • (1) is an analog audio input means, which comprises a microphone, a filter, an amplifier, and the like.
  • the AZD conversion means (2) is AZD conversion means for converting an analog audio signal into a digital audio signal. Further, the AZD conversion means (2) may incorporate digital signal compression means such as ADPCM.
  • (3) is a non-speech detection means, which detects a non-speech part automatically or visually.
  • (4) is a conversion unit which receives the output signals of the non-speech detection means (3) and the AZD conversion means (2) and outputs a digital audio signal based on the input signal from the non-speech detection means (3). This is a means to delete or convert the audio part to another code.
  • the soundless detection means (3) and the conversion section (4) constitute the soundless part display conversion means 5 in the present invention.
  • the conversion unit 4 may perform an algorithmic process using a CPU, a DSP, or the like.
  • Figure 1 shows a configuration in which analog audio is first converted to digital audio, and then silence is removed substantially.
  • the present invention is not limited to this. During the conversion process, or at the time of analog sound, the silence part may be substantially deleted.
  • the non-voice part in the input voice signal handled in the present invention indicates a voice-less part or a part close to a non-voice part, for example, between syllables or between syllables.
  • the display conversion means 5 for the non-speech part substantially deletes the non-speech part. For example, the whole or one part of the non-speech part is deleted, or the non-speech part is replaced with another code. It indicates conversion and so on.
  • Examples of a method of converting the audio portion into another code include, for example, converting the audio portion to a signal for deleting the audio portion, converting the audio portion to a signal indicating information on the time of the audio portion, or For example, it can be converted into a signal indicating information indicating the location in the input audio signal where the non-voice portion is located.
  • FIG. 2 schematically shows the configuration of a specific example of the audio reproducing means 200 used in the audio recording / reproducing apparatus according to the present invention.
  • audio reproducing means used in the audio recording / reproducing apparatus according to the present invention.
  • FIG. 2 is an example of the sound reproducing means 200, and is hereinafter referred to as a reproducing unit.
  • (11) is a recording medium, which is shown in FIG.
  • Reference numeral (112) denotes reading means, which comprises a pickup for reading, a means for rotating the recording means (11), a means for sliding the pickup for reading, and the like.
  • (12) is a detecting means, which is the output of the reading means (112). It detects the virtually removed silent part from the digital audio, restores the detected silent part, newly forms it, or converts it into a signal having the same meaning as these, and outputs it.
  • the adjusting means (13) is an adjusting means, which combines the digital audio signal output from the reading means (112) with the non-audio signal output from the detecting means (12), and outputs this combined signal. .
  • the detecting means (12) and the adjusting means (13) constitute the audio reproducing means 17 in the present invention.
  • the adjusting means 13 is algorithmically processed by one CPU, DSP one-chip microcomputer or the like. May be done. In this case, both means
  • the DZA conversion means (14) is DZA conversion means for converting the digital audio output from the adjustment means (13) into analog audio.
  • the DZA conversion means (14) has restoration means.
  • the DZA conversion means (14) may constitute one of the above-mentioned sound reproduction means 17, and may also serve as the detection means (12) and the adjustment means (13).
  • (15) is an amplifying means, which is a means for electrically amplifying analog audio.
  • the amplification means (15) may be further provided with a frequency filter characteristic.
  • (16) is a generating means, which comprises any or all of a speaker and an earphone.
  • the recording unit and the reproducing unit may be either an integrated type or a separate type.
  • the analog audio input to the analog audio input unit (1) is filtered and amplified, and then, as shown in FIG. 3 (A), by the AZD conversion means (2). Converted to digital audio signal.
  • the digital audio signal is input to the audioless detection means (3) and the conversion means (4).
  • the non-speech detection means (3) detects the non-speech part (31) shown in Fig. 3 (A), and the conversion means (4) uses the non-speech part as shown in Fig. 3 (B) (32).
  • 31 is converted to a digital audio signal 32 (FIG. 3 (B)) indicating the position where the silence part 31 is substantially deleted, and is recorded via the writing means (111). Written to the medium (11).
  • one of the digital voice strings indicates one syllable, one syllable, one step down, or from the silent part to the next silent part.
  • FIG. 2 showing the reproducing means 200 for reproducing the digital audio signal recorded on the recording medium (11)
  • the recording means (11) is read by the reading means.
  • the detecting means (12) detects a non-voice portion display data signal such as the deleted non-voice portion 32 shown in FIG. 3 (B), and determines a predetermined time width or original time width from information included in the signal.
  • the digital signal is converted into a non-voice digital signal having the following and output to the adjusting means (13).
  • the adjusting means (13) combines the non-voice digital signal input from the detection means (12) with the deleted part of the digital audio signal from which the substantially non-voice part has been deleted input from the recording means (11). Then, this combined digital audio signal (Fig.
  • DZA conversion means 14
  • D / A conversion means 14
  • the amplification means (15) amplifies the analog audio signal, optionally filters it, and outputs it to the utterance means (16).
  • the vocalization means (16) outputs sound using speed and earphones as a medium.
  • the utterance speed is adjusted independently by adjusting numerically adding and subtracting the amount of non-voice digital signal, and low-speed utterance can be easily implemented. For this adjustment, an adjustment knob may be mounted on the device so that the listener can make adjustment.
  • the digital audio including the converted display data signal in which the audioless part is substantially deleted may be recorded on a recording medium as shown in FIGS. 4 (A) and 4 (B).
  • the silence detection means (3) and the conversion means (4) use the silence part (41) of the original digital audio signal shown in FIG. 4 (A) as shown in FIG. 4 (B).
  • the digital audio signal shown in FIG. 4 (B) is written to the recording means (11) via the writing means (111).
  • the other codes (42) shown in FIG. 4 (B) indicate not only a mark but also a code of several bits having information on a non-speech time width and information indicating the characteristics of a non-speech part. is there.
  • the recording means (11) records the digital audio signal shown in FIG. 4 (B).
  • the reading means (112) reads the digital audio signal recorded in the recording means (11) from which the substantially silent part has been deleted, and outputs it to the detecting means (12) and the adjusting means (13). You.
  • the detecting means (12) detects a code which is added as an alternative to the deleted silent part of the input digital audio signal, decodes the code, and adjusts the signal according to the decoded content (13). ).
  • the content of the other reference numeral (42) shown in FIG. 4 (B) is the time width of the original non-voice portion of that portion as described above.
  • the adjusting means (13) deletes the signal input from the detecting means (12) and the silent part input from the reading means (112).
  • the digital audio signal (FIG. 4 (A)) to which the non-voice part is added or reproduced is output from the digital audio signal to the DZA conversion means (14).
  • DZ A conversion means (14) The subsequent operation is the same as described above, and therefore description thereof is omitted.
  • FIG. 15 shows an example of a speech input signal used in the present invention, but the present invention is not limited to this.
  • the window (WD) in Fig. 5 (A) is set in advance for the non-voice section.
  • Lth is a threshold value for determining that there is no voice, and is set in the (+) (-) direction.
  • the signs A to D shown in Fig. 5 (A) are determined in advance, and the initial value of the time width between the signs A to D is also set in advance.
  • the time width is only an initial value and can be changed. Find the smallest tn that satisfies the expression (1) between the time ts + 1 and ta at the current time ts.
  • V (ti) is a voltage value at a time ti before or after a predetermined time from the current time ts. Since four codes A to D are used in the present embodiment, they are expressed by about 2 bits, so that the non-speech part on the recording means is replaced with a few code strings. The number of codes is preferably as small as possible, but is not particularly limited.
  • the codes A to D determined in the above-described process are recorded on the recording medium (11) via the writing means (111).
  • the first window (WD1) is set, and if the four types of time factors are different in the window. This is for setting the checkpoints A to D. If the initial time of the window WD1 is ts, the checkpoint D is arranged at a position corresponding to the time of ts + 1. The time interval between the initial time and the check point D is 1 Z 4 ⁇ ⁇ t.
  • check point C is arranged at a position corresponding to the time of ts + 2, and the time interval between check point D and check point C is 1 Z 4 ⁇ t.
  • Check point B is arranged at a position corresponding to the time of ts + 3, and the time interval between check point C and check point B is ⁇ t.
  • check point A is arranged at a position corresponding to the time of ts + 4, and the check point B and the check point B are arranged.
  • ⁇ t be the time interval with A.
  • an audio signal N is input from an external input, and the input audio voltage V (n) is compared with the above-mentioned predetermined threshold value Lth.
  • the voltage V (n) of the audio input signal becomes lower than the threshold value Lth at time ts, and satisfies the relationship of the above equation (1).
  • the above-described window WD1 is set, and the input audio voltage V is continuously set at a predetermined sampling time interval during the inspection time set by the window WD1. (n) is compared with the threshold value Lth described above.
  • the audio input signal N satisfies the relationship of the above equation (1) within the elapsed time ts + 4 predetermined in the window WD1. Therefore, during this time, it is determined that the non-speech part is continued, and the code of A is given to the non-speech part at that time as the identification code.
  • the next window WD2 is set at that time. Is done.
  • the set time of the second window WD2 is made longer than the set time of the first window WD1.
  • the checkpoint D is arranged at a position corresponding to the time of ts + 1. Then, the time interval between the initial time and the check point D is 1 Z 4 ⁇ ⁇ t.
  • check point C is arranged at a position corresponding to the time of ts + 2, and the time interval between check point D and check point C is 1 to 4 ⁇ ⁇ t
  • Check point B is located at a position corresponding to the time of ts + 3, and the time interval between check point C and check point B is 2 ⁇ t + 3. I do.
  • check point A is arranged at a position corresponding to the time of ts + 4, and the time interval between the check point B and the check point A is 2 ⁇ t + 3.
  • the voltage V (n) of the input audio signal exceeds the above-described threshold value Lth just before the check point A in the second window WD2. It turns out that the non-voice part has ended.
  • a code B is given as an identification code to the non-voice portion of the input voice signal in window WD2.
  • a code string A ⁇ B is given to the non-voice portion of the audio input signal in this specific example, and the corresponding identification code is read out during reproduction, and corresponds to the identification code A ⁇ B.
  • the reproduction operation is executed while inserting a non-speech part into a predetermined position of a predetermined audio input signal to be reproduced for a certain period of time.
  • the digital audio recorded by the recording means (11) is read by the reading means
  • the detection means (12) detects the signals A to D shown in FIG. 5 (A) and the signal indicating the start of the silent state and the code, and detects the signal shown in FIG. 5 (A). Then, the data is restored to a silent section having a time width corresponding to the code, and output to the adjusting means (13).
  • the adjusting means (13) inserts the non-speech part output from the detecting means (12) into the parts of the code A to D of the digital sound.
  • the detection means (12) increases a part or all of the time width of the codes A to D shown in FIG. The width automatically increases in proportion to the number of repetitions.
  • the silent part can be automatically replaced with a small number of codes during recording, it is very convenient and highly streamlined. Since the restoration process time is short, there is an effect that there is no problem in reproducing sound output.
  • the size of the device configured using the above-described embodiment is preferably of a size that is portable, and in the case of a learning book, a function of outputting repeated voices or a bookmark-like function may be added. . Also, since the size of the device is also affected by the size of the recording medium, the recording medium must be small and have a high capacity, such as a CD-ROM, a mini-magneto-optical disk, and 3.5. An intact floppy disk, digital audio tape, etc. are suitable.
  • the digital audio does not need to be particularly limited, such as a synthesized audio, an A / D-converted or compressed audio of a natural audio, and indicates a voice converted by an existing method.
  • First step Input a predetermined amount of the audio data digitized in (2a). At this time, the predetermined amount is a number such as a unit of 1024, and depends on a recording element for temporarily storing. This may also be unnecessary.
  • step (2b) in order to distinguish between the control code previously set to be used as a code indicating no sound and the like and the sound data, the control code is obtained from the sound data in which 64 data is made into one block. Change the same or similar data as the data. This change is made, for example, by +1 (incrementing) this data.
  • step (2c) calculation is performed to determine the start and end of silence.
  • the audio data is divided into predetermined blocks (for example, one block is defined as 64 data), and data such as the audio amplitude distribution in the block is obtained.
  • step (2d) it is detected how much the amplitude distribution of the data obtained in step (2c) is within a predetermined range (for example, (800h ⁇ X ⁇ 80Fh)). If the data being recorded is within 90% of the silence range, a temporary silence start is assumed.
  • step (2d) If (yes) in step (2d), then it is checked in step (2e) whether the silence start flag is on. If the flag is off, silence start is determined here, and ( no), and the step of turning on the no-sound flag with respect to the temporary no-sound start point (2f). If the silence start flag has already been turned on in step (2e), it is in the silence interval, and step c (2g), which becomes (yes), is the part where the next predetermined number of data blocks are read. Yes, it is determined in step (2h) whether the data block is completed. If the data block is completed, the process returns to (yes). If not, the process returns to the silence range calculation step (2c). If finished, step (yes) In (2i), it is determined whether all data has been completed. If not completed, the result is (no). In step (2a), 1024 data are read again and temporarily recorded. , And continue processing after step (2a) o
  • step (2d) if it is not within the silent range (no), then it is determined in step (2j) whether or not this is the end of silence. % Or more is outside the silent range. In step (2j), if (yes) silent end, proceed to step (2k). If (no), proceed to step (2g) as non-silent part, and Read the number of data blocks. In step (2k), it is determined whether or not the silence start flag is turned on. If it is off, the process proceeds to step (2g) as (no). If the silence start flag is on, step as (yes)
  • step (2m) the number of bytes in the silent section is calculated. At this time, if there is a predetermined time or more between the provisional silence start point and the provisional silence end point, a true silence start point and a true silence end point are set. Further, when the duration of the silence set in accordance with the case is shorter than a predetermined time, a process of invalidating the duration without determining it as a silence section is performed. This processing is performed to prevent a situation in which the reading is continuous, but there is silence between the sounds, and the sound is not deleted. Appropriate for that. In step (2m), a control code based on silence detection and a code indicating the number of bytes indicating a silence section are determined and stored in the audio data. At step (2n), the silence start flag is turned off, a series of silence detection processing ends, and the routine proceeds to step (2g), where the next data block is read.
  • the non-speech part in the present invention refers to a soundless part or a part close to non-speech, such as between syllables or between syllables, as described above.
  • the substantial coding of the non-speech part means, for example, a state where all or one part of the non-speech part indicated by 31 in FIG. 3 (A) is indicated by 32 in FIG. 3 (B), or FIG. In A), the non-speech part indicated by 41 is converted into another code (42) shown in FIG.
  • FIG. 6 is a block diagram showing the configuration of another specific example of the audio recording / reproducing apparatus according to the present invention, wherein (11) is a storage medium, that is, a storage means. Disks, optical disks such as CDs and MDs, magnetic disks, IC storage media, and the like, particularly those with a small size and high capacity are preferred.
  • Reference numeral (22) denotes a drive element, which is a motor such as a spindle motor or a thread motor for driving the storage medium 11 and for moving the pickup. Also, there may be no case depending on the type of the storage medium.
  • (23) is an RF amplifier for amplifying and shaping the read signal, for example.
  • (24) is an adjusting means, which is composed of a DSP or the like, and is provided with an error correction processing, a PLL, and an EFM demodulating means when a general-purpose CD reproducing apparatus is used.
  • the drive means (25) is a means for controlling the rotation speed of the drive element (22), the reading positioning, and the like.
  • the input control means (27) is composed of a microcomputer or the like, and further includes an input signal of an external input (71) and a non-voice conversion means (26). The control signal based on the output signal is output to the adjusting means (24) and the soundless converting means (26).
  • the RF amplifier (23), the adjusting means (24), and the non-speech conversion means (26) constitute the non-speech part display conversion means 20.
  • (28) is a DZA conversion means, which converts a voice digital signal into an analog signal and outputs it. If data is subjected to compression processing such as ADPCM or ATC, the data shall further include a decompression process corresponding to this.
  • (29) is amplification means for amplifying and outputting analog audio.
  • (30) is an audio output means, which is composed of a speaker, an earphone, and the like.
  • the signal at (34) is the RF amplification means
  • the drive circuit (24) performs error correction and EFM demodulation processing on the input data and outputs the data. Further, the drive circuit (25) adjusts the rotation speed of the storage medium and adjusts the movement of the pickup, for example. It outputs a signal to do things and so on.
  • the non-speech conversion means (26) detects coded non-speech 'data from the output from the adjustment means (24), converts the data into speech data indicating no speech, and outputs the data.
  • the voiceless conversion means (26) easily changes the voiceless voice data range according to the signal from the input control means (27).
  • the input control means (27) causes the adjusting means (24) to input a signal corresponding to the input by a key input from the input (71), a thumb input, or the like.
  • the input control means (27) outputs a signal to the non-speech conversion means (26) for adding or deleting a signal range indicating a range of a non-speech part in order to adjust the speech speed slowly or quickly.
  • the audio data output by the non-audio conversion means (26) is converted to analog audio by the DZA conversion means (28), amplified by the amplifier circuit (29), and reproduced and output by the audio output means (30) .
  • the reading of the storage medium (11) is set to a specification of 44. KKHZ) resolution of about 16 bits like a general CD player, on the other hand, the DZA conversion etc.
  • the no-speech conversion means (26) temporarily stops reading and adjusts the delay. Therefore, a control signal may be output to the input control means (27). At this time, the input control means (27) causes the adjusting means (24) to perform operations such as stopping reading, decreasing the rotation speed, and stopping while keeping the rotation speed constant.
  • a predetermined amount of digital audio data is fetched from the adjusting means (24) and temporarily stored in the memory. Note that this memory is unnecessary when performing non-voice processing sequentially.
  • a signal for stopping or suppressing reading from the storage medium (11) is output to the input control means (27) as occasion demands.
  • the input control means (27) outputs the input signal to the adjusting means (24) to control the driving of the drive element (22) and the like.
  • step 21 After fetching a predetermined amount of voice data in step 21, the parameter input is confirmed from the input control means 27 in step 2a, and it is determined in step 2a whether the parameter input has been performed. If YES, step 2b is executed. In, set the number of parameters according to the input. 7 Also check in step 22 whether or not a silent output is being performed. Here, the state of the flag indicating that no sound is being output is checked. If the flag during unvoiced output is set (yes), the process proceeds to step 26, and the unvoiced output process is performed. If the flag is cleared, the process proceeds to step 23 if NO. In step 23, audio data is searched, and if there is a control code on the way, parameters are set.
  • step 24 it is determined whether or not the processing of the audio data has been completed. If the processing has been completed (yes), the operation proceeds to the operation for reading more data, and the operation becomes END. If not terminated (no), the flow shifts to step 25 to judge whether or not it is a no-sound control code. If it is not a voiceless control code, the process proceeds to step 27 assuming that the data indicates voice, and if it is a voiceless control code, the process proceeds to a voiceless output processing step 26. In the unvoiced output process in step 26, the unvoiced output flag is set, and data (for example, 808h) indicating a 0-level voice is output.
  • data for example, 808h
  • the set parameter of (Step 2b) is added to or subtracted from the parameter indicating the non-voice section, and this value is decremented by 1 (decrement) every time.
  • the added or subtracted parameter is set to 1 and the value becomes 0, the flag indicating that no sound is being output is cleared, and the soundless output ends.
  • the input parameters set in step 2b are cleared.
  • the non-voice output process step 26 the process waits for a time in step 32 to process the next data.
  • the waiting time in step 32 is about 125 microphone openings sec.
  • step 27 determines whether the data is an even number. If the data is even-numbered, (Yes) Performs 4-bit bit shift, and shifts to odd-numbered numbers so that data processing in byte units can be performed.
  • step 29 the 4-bit audio data is expanded to 12 bits.
  • the decompression algorithm is, for example, as follows. The first data (Y) is calculated at the 0 level (808h), and the second and subsequent times use the data obtained by the following calculation as the previous data. Subtract 4-bit audio data (X) from the reference value and multiply Multiply by the rate (m) and add the previous 12-bit data (Y) to obtain 12-bit audio data.
  • 12-bit audio data ((X—reference value) * m) + Y
  • the previous data is set to 0 level.
  • the reason why the data is expanded to 12 bits is that audio is digitized in 12 bits, and is not particularly limited together with the above-described algorithm.
  • the multiplication rate (m) is added to the data at the time of recording in order to increase the accuracy at the time of restoration, and is not particularly necessary.
  • step 30 the time when the audio data is odd-numbered is detected, and it is checked whether or not the audio data ends only at the odd-numbered time. This means, for example, that the flag corresponding to the entire audio data is decremented by 1 (decrement), and when it becomes 0, the operation for terminating at step 24 is performed.
  • the parameters set for controlling the utterance speed and the operation with respect to the parameters are not limited to those described above, but are performed by other methods such as an interrupt.
  • the processing style is not limited to software, but may be hardware. It may be due. It is preferable that the size of the device configured using the above-described embodiment is of a size that can be portable. There is also.
  • the recording medium since the size of the device is also affected by the size of the recording medium, the recording medium must be small and have a high capacity, such as a CD-ROM, mini-optical disk, Suitable for use are, but not limited to, intro-floppy discs and digital audio tapes.
  • the digital voice is not particularly limited, such as A / D conversion and compression-processed voice of natural voice, and indicates voice converted by other existing methods.
  • FIG. 91 is an audio input means, which is a microphone for generating an analog audio signal, a filter circuit, and an amplifier. Composed of circuits, etc. o
  • (92) is an AZD conversion means, which comprises a sampling circuit, an AZD converter circuit, etc., and further includes a circuit including various PCMs such as ADPCM, a compression function such as PWM and ATC as necessary. .
  • a non-speech detecting means which changes, deletes, moves, etc. data indicating confusing values such as a code indicating non-speech, a parameter code indicating duration, etc. from digital audio data in advance.
  • the silent part is detected, and this part is made to correspond to the code indicating no sound and the parameter code indicating the time width, and is added so as to be interrupted in the sound data.
  • non-speech deleting means which is a means for deleting from the voice digital data corresponding to the number of non-speech interval bytes following the non-speech control code.
  • (95) is a component control code conversion means for converting analog audio into digital data.
  • a 12-bit conversion means is used, and the recording medium is designed to record 4-bit data. 4 bits from the data or used as the conversion parameter when performing the conversion process in the reverse direction.
  • the part where the rate of change of the digital audio signal is large or the characteristic part is converted to the component control code. It is also a means for.
  • the component control code conversion means (95) cannot sufficiently restore the portion where the rate of change of the audio signal is large or the characteristic portion is usually required to increase the digital information, the data of this portion is used If the amount of digital information is reduced by replacing it with data indicating the number, i.e., component control code, and the audio data recorded on the recording medium is reduced to a bit number as small as about 4 bits, the This is for obtaining an analog audio signal with a waveform.
  • (96) is a rearrangement means. If control data such as a silence control code and voice data are mixed in a predetermined section, the silence control code part is replaced with voice data indicating silence, and the following is performed.
  • the control code is stored at the beginning of the section.
  • the mixed state of voice data and control code in a predetermined section means, for example, that a processing means such as a CPU has an 8-bit processing capability, and a voice data string is divided into 8 bits so that processing can be easily performed. This is the case where audio data and control data are present in these 8 bits.
  • the code of the lower 4 bits is placed at the beginning of the next predetermined section, and a process of substituting voice data indicating no voice is performed instead to distinguish the code from the voice data.
  • the recombining means also has a means for 4-bit encoding of digital audio.
  • (97) is a recording signal adjusting means for changing a signal of a form necessary for writing to a recording medium to an input signal.
  • conventional means such as EFM modulation shall be included.
  • the recording signal adjusting means (96) is composed of one or more DSPs and microcomputers. The selection is appropriately selected depending on the size of the apparatus, the size of the processing capacity, and the like.
  • the mixed data string in which the voice data and the like are combined is input to the voiceless deletion processing means (94), and voice data indicating voicelessness is deleted.
  • step (3a) the hybrid data is read directly from the non-speech detecting means (93) or indirectly via a buffer or the like.
  • step (3b) it is determined whether the first data is a silence detection control code. If it is a silence detection control code (yes), proceed to the next step (3d). If not, it becomes (no) and the silence detection control code and the number of silence section bytes 0 are forcibly stored in the buffer memory, and the process proceeds to step (3d). In step (3d), it is determined whether or not all data has been processed. If not (no), the hybrid data sequence is read again.
  • step (3f) it is determined whether or not the code is a silence detection control code. If so (yes), at step (3h), a silence detection control code and a byte indicating a silence section are determined. Only the number of data is stored and skipped. Further, in step (3i), the pointer of the data corresponding to the number of silence sections corresponding to the silence detection control code is advanced, and the data is reduced by the number of bytes corresponding to the silence section. In step (3f), the silence detection control code If not (no), the read data is determined to be audio data, and the data is stored in the buffer. By repeating the above, all data is organized into a data string consisting only of voice data, a silence detection control code, and a silence section byte number code. After performing the sequential or fixed amount deletion processing, the output of the voiceless deletion means (94) is input to the component control code conversion means (95).
  • step (4a) the data output by the soundless deletion means (94) is read.
  • the unit of data to be read is 256, and processing is performed in units of one.
  • step (4b) it is determined whether the processing data is a silence detection control code or not. If the processing data is a control code (yes), only the silence detection control code and the number of silent section bytes are used. Is stored in the buffer, the data is skipped as it is, and the procedure goes to step (4d) '. If the code is not the silence detection control code, the flow proceeds to step (4d). In step (4d), the difference between the previous data and the current data is obtained, and the maximum value of the difference data in the same mode is obtained from the difference data. In step (4d), it is determined whether or not the mode has been changed. If the mode has been changed (yes), the process proceeds to step (4e). If the mode is the same (no), go to step (4a) and process the next data.
  • step (4e) it is determined whether the mode change is a change to the plus / minus component mode.
  • the plus / minus component mode refers to data with little change in data, plus and minus components, and the difference between adjacent data is less than the specified value. It is.
  • step (4e) go to the (yes) direction if it corresponds to the plus / minus component mode, otherwise go to (no). If (yes), plus / minus control corresponding to plus / minus component mode
  • the code and the multiplication rate code are stored in the voice code data.
  • the multiplication rate code is used to compensate for the insufficiency in the bit representation of the change amount of the audio data, and expresses the change amount of the audio data by the multiplication rate.
  • the criterion for the multiplication rate code is arbitrary and is appropriately selected according to the digital bit representation of the audio data and the sample frequency. When the sample frequency is 8 KHz and the audio and control code digital data to be recorded on the recording medium are 4 bits, the multiplication rate is set as follows, for example.
  • the plus / minus direction has a reference value of 7, with 0 to 6 representing the negative component and 8 to 14 (Eh) representing the brass component.
  • the maximum change at this time is 7.
  • Maximum difference (B) (Fig. 13 (A)) Calculate the multiplication rate of one change with the maximum change amount.
  • step (4e) When step (4e) is (no), the process proceeds to step (4g) to determine whether the difference data matches or does not match in the positive component mode, and when they match, it corresponds to the positive component mode.
  • the plus control code and the multiplication rate are stored in the audio data.
  • the multiplication rate at this time is set as follows, for example.
  • the maximum change is set to 14 since it is expressed as 1 to 14 (Eh) with 0 as the reference value.
  • step (4h) the multiplication rate (maximum difference maximum change amount) is calculated to determine the multiplication rate per change.
  • the plus control code and the multiplying ratio are stored in the portion of the voice data detected in the plus component mode.
  • step (4 g) if, Step (4 i) at minus control codes, the odds of c minus component that stores the odds to the appropriate section of the audio data, directional (no)
  • the data shown is not required and is expressed as ⁇ 13 (Dh) with 14 as the reference value.
  • the maximum change amount is 14 (maximum difference maximum change amount), and the multiplication rate per change is calculated.
  • the converted data is input to the recombination means (96).
  • the rearrangement means (96) encodes 12 bits of audio data into 4 bits and rearranges the audio data and control code for the mixed data. Also, the operation means of the rearrangement means (96) in FIG. 9 will be described with reference to the flowchart (FIG. 14).
  • step (6a) the data is read, and the data is processed by dividing the data by a certain number.
  • step (6b) it is determined whether the control code is a control code or not. When the control code is not (no), when the sound is sound data, the 4-bit encoding is performed in step (6c). ). At this time, 4-bit encoding may be performed based on the component and multiplication rate information. An example of one conversion method to 12-bit and 4-bit is described.
  • the calculation is performed at the 0 level (808h), and for the second and subsequent times, the data obtained by the following calculation is used as the previous data.
  • 4-bit audio data (((n) -1 (n-1)) / m) + reference value component and multiplication rate were determined by the control code conversion means (95) shown in the previous section.
  • the component control code and the multiplication factor the code before rewriting is valid until rewriting occurs.
  • step (6c) it is determined whether the 4-bit audio data is even or odd. If the data is even (yes :), the encoded data is saved in the upper 4-bit register. In the case of an odd number (no), the encoded data is saved in the following 4-bit register. At the location where the upper and lower bits fit, in step (6g), the upper 4 bits and the lower 4 bits, a total of 1 byte, are stored in the buffer memory. Steps If the data is a control code in (6b), it is determined at this point in step (6h) whether or not the audio data is odd data end. At the end of the odd data (yes :), the control code section stores the voice that indicates no voice, and also stores the control code in the next upper 4 bits.
  • step (6j) the component control code (type, multiplication factor, etc.) accompanying the control code (Fh) is additionally stored. If the voice data ends in an even number in step (6h) (no), the processing in step (6j) described above is performed.
  • the data in which the audio data and the control code are arranged as described above are written to the temporary or main recording medium (18) via the recording signal adjusting means (97) and the write pickup (97P). It is.
  • the present invention can reproduce the reading voice of a book for a sufficient time even on a generally provided recording medium, and at the same time, makes the utterance speed variable during reproduction, and is different from ordinary reading. This has the effect that no sound can be output.
  • the present invention stores digital audio data in a storage medium in a form in which substantially no audio portions are encoded, and adds this silent time during reproduction to the storage medium. Is enough audio
  • this code contains information on the original non-speech part, so that a sound output close to natural reading can be obtained for a long time, and the desired time width can be set. Since non-speech data can be added arbitrarily, a speech playback device with variable reading speed, such as when learning slowly or quickly, such as a study book or commentary, is realized.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

明 細 書 音声記録再生装置 産業上の利用分野
本発明は、 音声記録再生装置に関するものであり、 更に詳しく は 学習教育機器或いは音声式電子ブック等の音声再生装置に関するも のである。
背景技術
CD - RO 等のディ ジタル高容量記憶媒体を用いて、 音声再生用の 装置があるが、 その再生時間は、 せいぜい 70分程度である。 この程 度の再生時間は、 音楽を録音するには充分であるが、 文庫本、 学習 書等の書籍を朗読した朗読音声全部を録音するには不足している。 特に聴者に理解と認識を与える為の学習器等の様な繰り返し且つ、 明確な音声を例えば低速のように速度を変えてしかも長時間再生出 力する場合、 上述のディ ジタル記憶媒体の使用は、 学習内容を調整 乃至省略しない限り困難なことであり、 その他の記憶媒体であって は、 なおさ らに困難である。
又、 特に記録時の朗読スピー ドを意図的に調整せざるを得ないこ とが多かつた。
本発明の目的は、 上記従来技術の問題点を解消し、 所定の記録媒 体には、 充分な音声データを格納させると共に、 再生時には自然の 朗読に近い音声出力が長時間にわたって得られる音声記録再生装置 を提供するものである。 発明の開示
上記目的を達成するため、 本発明に係る音声記録再生装置は、 基 本的には、 以下に示す様な技術構成を有するものである。
即ち、 音声信号に含まれる無音声部分を所定の無音声部分表示デ 一夕信号に変換して記憶した音声信号記憶手段、 記憶された音声信 号を所望の発話速度で再生する音声再生手段とから構成されている 音声再生装置であり、 より具体的には、 入力される音声信号に含ま れる無音声部分を所定の無音声部分表示データ信号に変換する無音 声部分表示変換手段、 当該無音声部分表示変換手段により変換され た該無音声部分表示データ信号を含む入力音声信号を記憶する記憶 手段とから構成されている音声記録再生装置であり、 更に具体的に は、 入力される音声信号に含まれる無音声部分を所定の無音声部分 表示データ信号に変換する無音声部分表示変換手段、 当該無音声部 分表示変換手段により変換された該無音声部分表示データ信号を含 む入力音声信号を記憶する記憶手段、 及び当該記憶手段に記憶され た入力音声信号を所望の発話速度で再生する音声再生手段とから構 成されている音声記録再生装置である。
つまり本発明においては本発明者が鋭意研究の結果、 実質的に無 音声部を削除した様式でディジタル音声データを記憶媒体に記憶さ せ、 再生時、 この無音声時間を付加することにより、 記憶媒体には、 充分な音声データが格納でき、 しかも再生時この無音声時間が付加 されていることから、 自然の朗読に近い音声出力が長時間得られる 学習教育器或は音声式電子ブッ ク等に使用可能な音声記録再生装置 を実現した。 図面の簡単な説明
図 1 は本発明の記録手段の実施例を示す図である。 図 2は本発明の再生手段の実施例を示す図である。
図 3 ( A) 、 図 3 (B) 、 図 4 ( A) 、 図 4 (B) は本発明の実 施例を説明するための図である。
図 5 ( A) 、 図 5 (B) は本発明における無音声部の長さを識別 する方法の例を示す図である。
図 6は本発明の他の実施例を示す図である。
図 7は図 6で示した無音声処理部を具体的に示すフローチャー ト である。
図 8 (A) 、 図 8 (B) は、 無音声部を実質的に削除した場合の 信号例の他の例を示す図である。
図 9は、 本発明に於ける別の具体例に於ける構成を示すプロ ッ ク ダイアグラムである。
図 1 0は、 本発明に於ける無音声部の判別を実施する為のフロー チヤ一トである。
図 1 1から図 1 2は、 図 9に示す本発明に於ける別の具体例に於 ける無音声部削除方法を実行する為の操作手順を示すフローチャー トである。
図 1 3 ( A) 〜図 1 3 ( C ) は、 本発明に於いて、 ブラス · マイ ナス成分モー ドを判別する例を説明する図である。
図 1 4は、 本発明に係る図 9の具体例に於ける組替え手段の操作 手順を説明するフローチヤ一トである。
図 1 5は、 本発明に於いて使用される音声入力信号の一例を示す 波形図である。 発明を実施するための最適な態様
以下に本発明に係る音声記録再生装置の具体例を図面を参照しな がら詳細に説明する。 即ち、 第 1 図は、 本発明に係る音声記録再生装置に於ける入力音 声信号の記録手段 100 の一具体例に於ける構成の概略を示すプロ ッ クダイアグラムであり、 図中、 入力される音声信号に含まれる無音 声部分を所定の無音声部分表示データ信号に変換する無音声部分表 示変換手段 5、 当該無音声部分表示変換手段 5 により変換された該 無音声部分表示データ信号を含む入力音声信号を記憶する記憶手段 11とから構成されている記録手段 100 が示されている。
更に、 上記具体例に付いて詳細に説明すると、
図 1 においては、 (11) は、 記録媒体であり、 主に光ディ スク、 光磁気ディスク、 磁気ディスク等のディ ジタル記憶媒体よりなる。
(111)は、 書き込み手段であり、 書き込み用へッ ド、 へッ ド駆動用 ドライバ等から構成される。 ( 1 ) は、 アナログ音声入力手段であ り、 マイ ク ロフォ ン、 フィルタ、 増幅器等から構成される。
( 2 ) は、 AZD変換手段であり、 アナログ音声信号をデジタル 音声信号に変換する。 更に AZD変換手段 ( 2 ) は、 ADPCM 等のデ ジタル信号圧縮手段を組み込む場合もある。 ( 3 ) は、 無音声検出 手段であり、 無音声部を自動的、 あるいは目視的によって検出する 部分である。 ( 4 ) は、 変換部であり、 無音声検出手段 ( 3 ) 及び AZD変換手段 ( 2 ) の出力信号を入力し、 無音声検出手段 ( 3 ) からの入力信号に基づいてデジタル音声信号の無音声部にたいし、 削除あるいは、 他の符号に変換処理を行う手段である。 無音声検出 手段 ( 3 ) 並びに変換部 ( 4 ) は本発明における無音声部分表示変 換手段 5を構成するものである。 尚該変換部 4 は CPU, DSPなどを用 いてアルゴリズム的処理を施すものであってもよい。 この場合、 両 手段 ( 3 )(4 ) の区別は、 無く なるものである。 図 1 は、 アナログ 音声を最初にデジタル音声に変換した後、 無音声部の実質的削除を 行う構成を示したが、 これに限られるものではなく、 例えばデジ夕 ル変換行程中、 あるいはアナ口グ音声時に無音声部の実質的削除が おこなわれるものであってもよい。
ところで本発明において取り扱う入力音声信号における無音声部 とは、 例えば音節間、 文節間等々の音声的に無音乃至無音に近い部 分を示すものである。 本発明において無音声部分の表示変換手段 5 は無音声部の実質的削除を行う ものであって、 例えば無音声部の全 部又は 1部の削除するとかあるいは、 無音声部を他の符号に変換す ること等々を示すものである。
係る音声部分を他の符号に変換する方法の例と しては、 例えば、 当該無音声部分を削除する信号に変換するとか、 当該無音声部分の 時間に関する情報を示す信号に変換するとか、 或いは当該無音声部 分が配置されている当該入力音声信号内に於ける存在位置を表す情 報を示す信号に変換する等が可能である。
次に、 本発明に係る音声記録再生装置に於いて使用される音声再 生手段 200 の一具体例の構成の概略を図 2 に示す。
即ち、 図 2 に於いては、 図 1 に示された音声記録手段 100 により 所定の記録媒体 11に記憶された音声データである入力音声信号を所 望の発話速度で再生する音声再生手段 17が設けられているものであ る ο
更に、 本発明に係る音声記録再生装置に使用される音声再生手段
200 の具体的な構成を説明する。
即ち図 2 は、 音声再生手段 200 の一例であり、 以下再生部と称す る。 (1 1 ) は、 記録媒体であり、 図 1で示したものである。
( 112)は読み取り手段であり、 読み取り用ピックアップ、 記録手 段 (11 ) を回転させる手段、 読み取り用ピッ クアップを摺動させる 手段等から構成される。
( 12) は、 検出手段であり、 読み取り手段 (112)が出力するディ ジタル音声から、 実質的に削除された無音声部を検出し、 検出した 無音声部を復元又は、 新たに形成又は、 これらと同等の意味を持つ 信号に変換し、 出力するものである。
( 13) は調整手段であり、 読み取り手段 (112)から出力されたデ イ ジタル音声信号と、 検出手段 (12) が出力した無音声信号とを組 み合わせた後、 この組み合わせ信号を出力する。 検出手段 (12) 、 調整手段 (13) は本発明における音声再生手段 17を構成するもので ある、 又、 調整手段 13は 1 つの CPU, DSPワ ンチップマイ コ ン等によ つてアルゴリ ズム的に処理される場合がある。 この場合、 両手段
( 12) (13) を区別する必要はなく、 すく なく とも削除された無音声 部を任意の無音声時間、 又は原無音声時間を有する無音声ディ ジタ ル信号に変換し、 ディ ジタル音声と組み合わせて出力するプログラ ムルーチン等のアルゴリ ズムを有すればよいものである。
( 14) は D Z A変換手段であり、 調整手段 (13) から出力される ディ ジタル音声をアナログ音声に変換するものである。 この時、 図 1 でしめす A Z D変換手段 ( 2 ) が圧縮手段を有している場合、 D Z A変換手段 (14) は、 復元手段を有するものである。 又、 D Z A 変換手段 (14) は前記した音声再生手段 17の 1 つを構成してもよ く 又、 検出手段 (12) 、 調整手段 (13) を兼ねる場合もある。
( 15) は、 増幅手段であり、 アナログ音声を電気的に増幅する手 段である。
尚、 増幅手段 (15) には更に周波数フ ィ ルタ特性が付加されたも のであってもよい。
(16) は、 発生手段であり、 スピーカ、 イヤホーンの何れか、 あ るいは全部等よりなる。 尚、 記録部及び再生部は両部一体型または 別体型何れの場合でも良い。
次に図 1及び図 2 にもとづいて本発明に係る音声記録再生装置の 記録手段 100 と再生手段 200 の動作の一例を説明する。
図 1で示す記録部 100 において、 アナログ音声入力部 ( 1 ) に入 力されたアナログ音声は、 ろ波、 増幅されたのち、 AZD変換手段 ( 2 ) において、 図 3 ( A) に示すようにデジタル音声信号に変換 される。 デジタル音声信号は、 無音声検出手段 ( 3 ) 並びに変換手 段 ( 4 ) に入力される。 無音声検出手段 ( 3 ) で、 図 3 ( A) で示 す無音声部 (31) が検出され、 変換手段 ( 4 ) で図 3 (B) でしめ す (32) のように無音声部 31は、 実質的に削除されその代りに、 無 音声部 31が実質的に削除された位置を示すデジタル音声信号 32 (図 3 (B))に変換され、 書き込み手段 (111)を介して記録媒体 (11) に書き込まれる。
尚、 ディ ジタル音声信号列は、 非常にこまかいことから、 省略し て描いた。 又、 ディ ジタル音声列の 1つは、 1音節、 1文節、 1段 落あるいは、 無音声部から、 次の無音声部迄等が示される。
次に記録媒体 (11) に記録されたディ ジタル音声信号を再生する 再生手段 200 を示す図 2に於て、 記録手段 (11) を読み取り手段
(112)にセッ ト し、 記録手段 (11) から、 実質的に無音声部が削除 されたディ ジタル音声信号が読み取られ、 無音声部分表示変換手段 17を構成する検出手段 (12) 、 並びに調整手段 (13) に出力される。 検出手段 (12) は、 図 3 (B) に示す削除された無音声部 32のよう な無音声部分表示データ信号を検出し、 その信号に含まれる情報か ら所定の時間幅又は原時間幅を有する無音声ディ ジタル信号に変換 し、 調整手段 (13) に出力する。 調整手段 (13) は、 記録手段 (11) から入力された実質的に無音声部が削除されたディ ジタル音声信号 の削除部に検出手段 (12) から入力された無音声ディ ジタル信号を 組み合わせて、 この組み合わせディ ジタル音声信号 (図 3 (A))を DZA変換手段 (14) に出力する。 D/A変換手段 (14) は、 入力 された組み合わせディ ジタル音声信号をアナログ音声信号に変換出 力する。 増幅手段 (15) は、 このアナログ音声信号を増幅、 場合に よってろ波し、 発声手段 (16) に出力する。 発声手段 (16) は、 ス ピー力、 イヤホンを媒体と して音声を出力する。 この時、 無音声デ イ ジタル信号量の数値的加算、 減算等の調整により、 発話速度は自 在に調整され、 低速発話も容易に実施できる。 この調整は、 聴者が 調整できるように調整用のツマミを装置上に装着される場合もある。 又、 実質的に無音声部が削除され適宜の変換表示データ信号を含 むディ ジタル音声は、 図 4 ( A ), (B ) で示す様に記録媒体に記録 される場合もある。 図 1 の記録部において、 無音声検出手段 ( 3 ) 、 変換手段 ( 4 ) は、 図 4 ( A ) で示す原ディ ジタル音声信号の無音 声部 (41) を図 4 ( B ) で示す様に、 他の符号 (42) で置換する。 図 4 ( B ) で示すディ ジタル音声信号は、 書き込み手段 (111 )を介 して記録手段 (11) に書き込まれる。 図 4 ( B ) で示す他の符号 ( 42) とは、 単なる目印の他、 無音声時間幅の情報、 無音声部の性 質を示す情報を具備した数ビッ 卜の符号等を示すものである。
図 2の再生部 200 に於て、 記録手段 (11 ) は図 4 ( B ) で示すデ ィ ジタル音声信号を記録している。 読み取り手段 (112)は、 この記 録手段 (11 ) に記録された実質的に無音声部が削除されたディ ジタ ル音声信号を読み出し、 検出手段 (12) 、 調整手段 (13) に出力す る。
検出手段 (12) は、 入力されたディ ジタル音声信号の削除された 無音声部に代替付加されている符号を検出した後、 その符号を解読 し、 解読内容に従った信号を調整手段 (13) に出力する。 図 4 ( B ) で示す他の符号 (42) の内容は上述の様にその部分の原無音声部の 時間幅等である。 調整手段 (13) は、 検出手段 (12) から入力され た信号と、 読み取り手段 (112)から入力された無音声部が削除され たディ ジタル音声信号より、 無音声部を付加乃至再現したディ ジタ ル音声信号 (図 4 (A))を DZA変換手段 (14) に出力する。 DZ A変換手段 (14) 以降の動作は、 前述と同一なので説明は省略する 次に本発明におけるアナ口グ音声入力信号から無音声部を検出し その無音声部を実質的に削除するとともにその長さを時間的関数を 表わす符号におきかえる他のアルゴリズムの一例について説明する 尚本発明に使用される音声入力信号の例を図 15に示しておくが、 こ れに限定されるものではない。
図 1で示す記録部に於て、 無音声部に対し、 図 5 ( A) のウィ ン ドウ (WD) を予じめ設定しておく。 Lth は、 無音声と判断する為の 閾値であり、 ( + )(—) 方向に設定されている。 図 5 ( A) で示す A〜Dの符号は予じめ決定されており、 又 A〜Dの符号間の時間幅 の初期値も予じめ設定されている。 尚、 時間幅は初期値だけであつ て可変可能である。 現時点 tsに於いて時刻 ts+ 1 から taまでの間で ( 1 ) 式を満たす最小の tnを見つける。
I V(tn) 一 V(ts) I > Lth ( 1 ) tnが見つからなければ符号 Aをとり、 再びこの符号 Aを現時点 ts と して次のウィ ン ドウ (WD 1 ) を設定し図 5 (A) で示すウ ィ ン ド ゥ上で次の tnを見つける動作をする。
例えばその他の場合、 tb< tn≤ taの時は符号 Bを取り、 その後、 符号の付与を中止する。 以下同じく ts + 2 く tn< tbのときは符号 C を取り、 tn^ ts+ 2のときは符号 Dをとり、 その後、 それぞれ符号 の付与を中止する。
次に
I V(ti) ― V(ts) I ≤ Lth
となった時、 無音声の削除処理が再開される。 この時、 再開を示す 符号が付与される。 符号 Aが繰り返し、 又は多数の頻度で選択される場合、 A~D符 号間の時間幅の全体乃至一部は長く なる。
V(ti) は、 現時点 tsから、 所定の時間前乃至時間後の時間 ti時の 電圧値である。 本実施例で使用される符号は、 A〜Dの 4個である から、 2 ビッ ト程度で表現されるので記録手段上での無音声部はわ ずかの符号列で置き換わるものである。 尚、 符号の数は、 少ない方 が好ま しいが、 特に限定されるものではない。 上述した行程に於て 決定された符号 A〜Dが書き込み手段 (111)を介して記録媒体 (11) に記録される。
ここで、 本発明に於ける入力音声信号の無音声部分の時間幅を検 出して、 識別符号を付与する方法の別の具体例を図 5 (B ) を参照 しながら説明する。
即ち、 図 5 (B) に示す様に、 本具体例に於いては、 先ず第 1 の ウィ ン ドウ ( WD 1 ) を設定し、 当該ウィ ン ドウ内に 4種の時間のフ アクターを異ならせたチヱ ッ クポィ ン ト A〜Dを設定するものであ り、 当該ウィ ン ドウ WD 1 の初期時刻を tsとすると、 チヱ ックポイ ン ト Dは、 ts+ 1 の時刻に相当する位置に配置されるものであり、 そ の初期時刻と該チェ ックポイ ン ト Dとの時間間隔を 1 Z 4 · Δ t と する。
同様にチヱ ッ クポイ ン ト Cは、 ts+ 2の時刻に相当する位置に配 置されるものであり、 該チェ ッ クポイン ト Dと該チェ ッ クポイ ン 卜 Cとの時間間隔を 1 Z 4 · Δ t とする。
又、 チヱ ッ クポイ ン ト Bは、 ts+ 3の時刻に相当する位置に配置 されるものであり、 該チェ ックポイ ン ト Cと該チェ ッ クポイ ン ト B との時間間隔を Δ t とする。
更に、 チヱ ックポイ ン ト Aは、 ts+ 4の時刻に相当する位置に配 置されるものであり、 該チェ ッ クポイ ン ト Bと該チェ ッ クポイ ン ト Aとの時間間隔を Δ t とする。
係るウイ ン ドウ WD 1 を設定したのち、 外部入力から音声信号 Nが 入力され、 その入力音声電圧 V(n)と前記した予め定められたしきい 値 Lth とが比較される。
本具体例に於いては、 音声入力信号の電圧 V(n)が、 時刻 tsで、 前 記しきい値 Lth より低く なり、 前記した式 ( 1 ) の関係を満たす事 になる。
その時点で、 上記したゥィ ン ドウ WD 1 が設定され、 当該ゥィ ン ド ゥ WD 1 で設定された検査時間の間、 継続して、 所定のサンプリ ング 時間間隔で、 該入力音声電圧 V(n)と前記したしきい値 Lth とが比較 される。
図 5 ( B ) の具体例では、 当該ウィ ン ドウ WD 1 で予め定められた 経過時間 ts+ 4の時間内では、 当該音声入力信号 Nは、 前記した式 ( 1 ) の関係を満足しており、 従って、 この間は、 無音声部が継続 されているものと判断され、 その時の無音声部分に対しては、 識別 符号と して Aの符号が付与される。
更に、 本具体例に於いては、 時刻 ts+ 4の時間が経過した時点で、 無音声部分が継続されていると判断された場合には、 その時点で、 次のゥイ ン ドウ WD2が設定される。
つまり、 チェ ッ クポイ ン ト Aに於ける ts+ 4の時刻に於いて、 再 びウィ ン ドウの初期時刻、 つまり tsが開始される事になる。
又、 本具体例に於いては、 ウィ ン ドウ WD 1 に於いて、 無音声部分 が継続されているので、 次のウイ ン ドウ WD 2 に於いても無音声部分 が、 長く続く との予想から、 第 2のウィ ン ドウ WD 2の設定時間を、 第 1 のウィ ン ドウ WD 1 の設定時間より も長くするものである。
つまり、 当該ウィ ン ドウ WD2 の初期時刻を tsとすると、 チヱ ッ ク ボイ ン ト Dは、 ts+ 1 の時刻に相当する位置に配置されるものであ り、 その初期時刻と該チェ ックポイ ン ト Dとの時間間隔を 1 Z 4 · Δ t とする。
同様にチェ ックポイ ン ト Cは、 t s + 2の時刻に相当する位置に配 置されるものであり、 該チェ ッ クポイ ン ト Dと該チェ ッ クポイ ン ト Cとの時間間隔を 1ノ 4 · △ t とする。
又、 チェ ックポイ ン ト Bは、 t s + 3の時刻に相当する位置に配置 されるものであり、 該チェ ックポイ ン ト Cと該チェ ックポイ ン ト B との時間間隔を 2 Δ t + 3 とする。
更に、 チヱ ックポイ ン ト Aは、 t s + 4の時刻に相当する位置に配 置されるものであり、 該チェ ックポイ ン ト Bと該チユ ックポイ ン ト Aとの時間間隔を 2 Δ t + 3 とする。
そして、 本具体例に於いては、 入力音声信号の電圧 V (n)が、 第 2 のウイ ン ドウ WD 2 に於けるチヱ ックポイ ン ト Aの直前で、 前記した しきい値 L t h を越え、 無音声部分が終了した事が判る。
その為、 当該ウィ ン ドウ WD 2 に於ける入力音声信号の無音声部に 対しては、 識別符号と して Bの符号が付与される。
従って、 本具体例に於ける当該音声入力信号の無音声部分に対し ては、 A · Bと言う符号列が与えられ、 係る識別符号を再生時に読 出して、 当該識別符号 A · Bに相当する時間だけ、 再生される所定 の音声入力信号の所定の位置に無音声部を揷入しながら再生操作を 実行するものである。
この様にして、 ディ ジタル音声が記録された記録手段が図 2で示 す再生手段 200 で再生される際の動作を説明する。
記録手段 (1 1 ) で記録されたディ ジタル音声が読み取り手段
( 1 12)で読み取られ、 検出手段 (12) 並びに調整手段 (13 ) に入力 される。 検出手段 (12) は、 図 5 ( A ) で示した符号 A〜D乃至無 音声開始を示す信号並びに符号を検出し、 図 5 ( A ) で示したウイ ン ドウに当てはめ、 その符号に応じた時間幅を有する無音声部で復 元し、 調整手段 (13) に出力する。 調整手段 (13) は、 ディ ジタル 音声の符号 A〜Dの部分に検出手段 (12) から出力された無音声部 を挿入していく。 又、 検出手段 (12) は、 符号 Aが繰り返し出現す る場合、 図 5 ( A ) で示す符号 A〜Dの時間幅の一部乃至全部も長 く なり、 復元される無音声部の時間幅も繰り返し回数に比例する様 に自動的に長く なつていく。
以上の様に、 記録時、 無音声部が少ない符号で自動的に置き換え 可能であることから、 非常に至便、 且つ合理性に富み、 再生時、 少 ない符号であつても正確な無音声時間を復元でき、 しかも復元処理 時間が短いので、 再生音声出力に支障がない等の効果がある。
尚、 上述した A〜Dの符号の付与並びに符号に基づく処理内容等 々はあく まで一例であり、 限られるものではない。
上述した実施例を使用して構成させる装置の大きさは、 携帯型が できる程度が好ま しく、 学習書であれば、 反復する音声を出力する 機能や、 しおり的な機能を付加する場合もある。 又、 装置の大きさ は、 記録媒体の大きさにも左右されることから、 記録媒体は、 小さ くてしかも高容量であるもの、 例えば CD— ROM 、 ミニ光磁気デイ ス ク、 3. 5イ ンチフロ ッ ピィ ディ スク、 デジタルオーディ オテープ等 が適当である。
尚、 ディ ジタル音声は、 合成音声、 自然音声を A / D変換、 圧縮 処理した音声等、 特に限定する必要はなく、 既存の方式によって変 換された音声を示すものである。
次に上記した入力音声信号に無音声部が含まれているかどうかを 判断する方法をソフ トウエアを用いて実現する場合の例を図 10に示 すフローチヤ一 トを用いて操作手順に従って説明する。 尚装置の構 成と しては図 1 に示すものが基本的には用いられる。 先ずステップ ( 2 a ) でディ ジタル化した音声データを所定量分入力する。 この 時、 所定量とは、 1024個単位等の数であり、 一時的に格納する為の 記録素子に依存する。 又、 これは不用な場合もある。
ステップ ( 2 b ) で予め無音声を示す符号等と して使用する為に 設定した制御コー ドと音声データとを区別する為、 64データを 1 ブ ロッ クと した音声データから、 制御コ一 ドと同一乃至類似するデ一 タを変更させる。 この変更は、 例えばこのデータに + 1 (イ ンク リ メ ン ト) することによって行われる。
尚、 この + 1 (イ ンク リ メ ン ト) によって音声データの内容は、 変更されるが実際、 再生出力音声にはなんら影響が無いのである。 次にステップ ( 2 c ) に於いて無音の開始終了を決定するための計 算を行う。 計算例と しては音声データを所定のブロ ック単位 (例え ば 1 ブロ ックを 64デ一タとする。 ) で'区切り、 そのブロックでの音 声振幅分布等のデータを得る。 ステップ ( 2 d ) に於いて、 ステツ プ ( 2 c ) で得られたデータの振幅分布が所定の範囲 (例えば(800 h≤ X≤ 80Fh) )にどれだけあるかが検出され、 もし 1 ブロ ッ ク中の データが該無音範囲に 90 %以上あれば、 仮の無音声開始とされ
(ye s)となり、 それ以外の時は、 (no) となる。 ステップ ( 2 d ) で (yes)の時、 次にステップ ( 2 e ) で無音開始フラグがオンされ ているかどうか調べられ、 フラグがオフ していればここで無音開始 が確実に決定され、 (no) となり、 仮の無音声開始点に対し無音声 フラグがオンするステップ ( 2 f ) 。 ステップ ( 2 e ) で既に無音 開始フラグがオンしている時は、 無音区間中てあり、 (ye s)となる c ステップ ( 2 g ) は、 次の所定数データブロ ックを読み込む部分で あり、 ステップ ( 2 h ) にてそのデータブロ ックが終了かどうか判 定され、 終了の時は、 (yes)、 終了でない時は、 無音範囲計算ステ ップ ( 2 c ) に戻る。 も し終了の場合は、 (ye s)となるステップ ( 2 i ) にて全データが終了したか判定し、 も し終了していない場 合は、 (no) となり、 ステップ ( 2 a ) にて再び 1024個のデータを 読み取り、 一時的に記録させ、 ステップ ( 2 a ) 以降の処理を続け o
ステップ ( 2 d ) に於いて、 もし無音範囲でない場合 (no) とな り、 これが無音終了なのかどうかステップ ( 2 j ) にて判定される, 判定の基準は、 例えば所定数のデータ中 50%以上が無音範囲でない 場合である。 ステップ ( 2 j ) にて (yes)無音終了であれば、 ステ ップ ( 2 k ) へ進み、 (no) であれば無音部分でないと してステツ プ ( 2 g ) へ進み、 次の所定数のデータブロ ッ クを読み込む。 ステ ップ ( 2 k ) で、 無音開始フラグがォンしているか判定され、 も し オフ しているのならば (no) と してステップ ( 2 g ) へ進む。 も し 無音開始フラグがォンしていたならば、 (yes)と してステップ
( 2 1 ) にて無音区間のバイ ト数が計算される。 この時、 仮の無音 開始点と仮の無音終了点との間が所定時間以上ある場合、 真の無音 開始点と真の無音終了点が設定される。 又、 場合に応じて設定され た無音声の持続時間が所定の時間より短い時これを無音区間と判断 せず無効とする処理が施される。 この処理は、 朗読が連続してはい るが音と音との間が無音の状態であつて、 無音削除の対象となつて しまい削除した結果と して再生時違和感が発生するのを防ぐための ものと して適当である。 ステップ ( 2 m) にて無音検出による制御 コ一 ドと無音区間を示すバイ ト数コ一ドが決定され、 音声データの 中に格納される。 ステップ ( 2 n ) にて、 無音開始フラグがオフ し 、 一連の無音検出処理が終わり、 ステップ ( 2 g ) へ移行し、 次の データプロ ッ クが読み出される。
次に本発明に係る音声記録再生装置の他の具体例を図 6〜図 8を 参照しながら以下に説明する。 処で本発明における無音声部とは、 上述したように例えば音節間、 文節間等々の音声的に無音乃至無音に近い部分を示すものである。 又、 無音声部の実質的な符号化とは、 例えば図 3 ( A ) において 31 で示す無音声部の全部又は 1部を図 3 ( B ) において 32で示す様な 状態、 又は図 4 ( A ) において 41で示す無音声部を図 4 ( B ) で示 す他の符号 (42) に変換すること、 あるいは、 図 8 ( A ) で示す様 に音声部 (01, 02,〜0ιτ·· ) に対し無音声部 (Μ1,Μ2,〜Μι!…) の全部 又はその一部を図 8 ( Β ) の様に特定の領域に集めることも含むも のである。
即ち図 6 は本発明に係る音声記録再生装置の他の具体例の構成を 示すブロ ッ クダイアグラムであって、 (11 ) は記憶媒体即ち記憶手 段であり、 MD, MO等の光磁気、 ディ スク、 CD, MD等の光ディ スク、 磁気ディ スク、 I C記憶媒体等であって、 特に小型で高容量なものが 好ま しい。
(22) は駆動素子であって、 記憶媒体 11を駆動させる為、 及びピ ッ クアップを動かす為のスピン ドルモータ、 スレツ ドモータ等の電 動機等である。 又、 記憶媒体の種類によって無い場合もある。
(23) は、 RF増幅器であって、 例えば、 読み取った信号を増幅、 整形する為のものである。 (24) は、 調整手段であり、 DSP 等で構 成され、 誤り訂正処理、 PLL 等、 更に汎用 CD再生装置を利用 した場 合は、 EFM 復調手段等を具備する。
( 25) は、 駆動手段であって、 駆動素子 (22) の回転数、 読み取り 位置決め等の制御をする為の手段である。
( 26) は、 無音声変換手段であり、 マイ コン、 AS I C等で構成され、 符号化された無音声部をその符号並びに外部入力に応じて再生する 為の手段である。 (27) は、 入力制御手段であり、 マイ コ ン等で構 成され、 更に外部入力 (71 ) の入力信号並びに無音声変換手段 (26 ) の出力信号に基づいた制御信号を調整手段 (24) 並びに無音声変換 手段 (26) に出力する。
即ち、 本具体例においては、 RF増幅器 (23) 、 調整手段 (24) 及 び無音声変換手段 (26) とによって無音声部分表示変換手段 20が構 成される。
尚 (28) は、 D Z A変換手段であり、 音声ディ ジタル信号をアナ ログ信号に変換し出力する。 尚、 ADPCM, ATC等の圧縮処理がデータ に施されている場合は、 これに対応した復元処理を更に含むものと する。
(29) は、 増幅手段であり、 アナログ音声を増幅し出力する。
(30) は音声出力手段であり、 スピーカ、 イヤホーン等で構成さ れる。
次に動作を説明する。
記憶媒体 (11 ) 上から駆動素子 (22) を介して得られたディ ジタ ル音声並びに符号化無音声データとの混在信号例えば図 3 ( B ) の 信号 (32) 、 又は図 4 ( B ) における信号 (34) は、 RF増幅手段
(23) で、 増幅整形され、 調整手段 (24) に入力される。 調整手段
(24) は、 入力されたデータに対し、 誤り訂正、 EFM 復調処理を施 した出力を行い、 更に駆動回路 (25) に対し、 例えば記憶媒体の回 転速度の調整、 ピッ クァップの移動の調整等々を行う為の信号を出 力する。 無音声変換手段 (26) は、 調整手段 (24) からの出力に対 し、 符号化無音声 'データを検出し、 無音声を示す音声データに変換 し、 出力する。 無音声変換手段 (26) は、 入力制御手段 (27) から の信号により、 無音声の音声データ範囲を容易に変化させる。 入力 制御手段 (27) は、 入力 (71 ) からのキー入力、 ッマミ入力等によ つてその入力に応じた信号を調整手段 (24) に入力させ、 例えば、 キー入力がポーズ、 頭だし、 リ ピー ト等の操作に基づく信号を調整 手段 (24) に入力させて駆動回路 (25) を調整させたりする。 又、 入力制御手段 (27) は、 無音声変換手段 (26) に対し、 発話速度を 遅く又は速く調整するため無音声部の範囲を示す信号範囲を加算乃 至削除する為の信号を出力する。 無音声変換手段 (26) が出力した 音声データは、 D Z A変換手段 (28) にてアナログ音声に変換され た後、 増幅回路 (29) で増幅され、 音声出力手段 (30) で再生出力 される。 又、 記憶媒体 (1 1 ) の読み取りが、 一般の CDプレーヤの様 に 44. KKHZ ) 分解能 16ビッ ト程度の仕様と した場合、 これに対し無 音声復元処理時、 D Z A変換等が例えば、 8 KH z 分解能 4 ビッ ト、 あるいは 12ビッ ト程度と比較的処理スピー ドの遅く、 しかも発話速 度を遅く調整した場合、 無音声変換手段 (26) は読み取りを一時的 にでも停止、 遅延調整すべく、 入力制御手段 (27 ) へ制御信号を出 力する場合もある。 この時、 入力制御手段 (27) は、 調整手段 (24 ) へ、 回転速度一定のまま読み取りの停止、 回転速度の低下、 停止等 の動作を行わせるものとする。
次に無音声変換手段 (26) のより具体的な動作例について図 7を 参照して説明する。 まずスター ト後ステップ 21で調整手段 (24 ) か ら、 ディ ジタル音声データを所定量だけ取り込み、 一時的にメモリ に格納する。 尚、 このメモリは逐次無音声処理を行う場合等は不用 となる。 所定量だけ取り込んだ後、 場合に応じて記憶媒体 (1 1 ) か らの読み取りを停止乃至抑制する信号を入力制御手段 (27) に出力 する。 入力制御手段 (27) は、 この入力された信号を調整手段 (24 ) へ出力し、 駆動素子 (22) 等々の駆動を制御する。
ステップ 21で所定量だけ音声データを取り込んだ後ステップ 2 a において入力制御手段 27からパラメータ入力を確認しステップ 2 a においてパラメ一夕入力が有つたかどうかが判断され YES の時はス テツプ 2 bにおいて、 その入力に応じたパラメータ数をセッ トする。 7 又ステップ 22に於いて無声出力中であるか確認する。 ここでは、 無 音声出力中を示すフラグの状態を確認している。 無声出力中のフラ グが立っていれば (y e s )ステップ 26にすすみ無声出力処理が行われ、 ク リアされていれば、 NOであれば次のステップ 23に移行する。 ステ ップ 23では、 音声データを探し、 途中制御コー ドが有ればパラメ一 タをセッ 卜する。 次にステップ 24において音声データの処理が終了 したかどうかという判定をし、 終了した場合 (y e s)、 更にデータを 読み込む為、 等の動作へ移行して END となる。 終了しない場合 (n o ) の時は、 ステップ 25に移行し、 無音声制御コ一ドであるかないかを 判定する。 無音声制御コー ドでない場合は、 該データが音声を示す ものであると してステツプ 27へ移行し、 無音声制御コー ドである場 合は無声出力処理ステツプ 26へ移行する。 ステップ 26における無声 出力処理では、 無声出力中フラグを立てると共に 0 レベルの音声を 示すデータ (例えば 808 h ) を出力する。 更に無音声区間を示すパ ラメータに対し、 (ステップ 2 b ) のセッ 卜されたパラメータを加 算乃至減算し、 この値を毎回一 1 (デク リ メ ン ト) する。 加算乃至 減算されたパラメータが一 1 され、 値が 0 になったとき、 無音声出 力中を示すフラグはク リアされ、 無音声出力は終了する。 尚上記両 パラメ一夕の加算乃至減算後、 ステップ 2 bでセッ トされた入力パ ラメータはク リアされる。 無音声出力処理ステップ 26が終了した後、 ステップ 32において時間待ちをして、 次のデータの処理を行う。
尚、 本実施例での時間待ちは、 復号時のサンプル周波数を 8 (KH z ) と設定している為ステップ 32での時間待ちは、 だいたい 1 25マイク 口 s e c となる。
一方ステップ 25に於いて無音声制御コー ドでない (n o ) の場合、 すなわち、 音声データである場合、 ステップ 27に於いてそのデータ が偶数番目であるかを判定する。 こ こでデータが偶数番目であると き (yes) 4 ビッ 卜のビッ トシフ トを行い、 バイ ト単位のデータ処理 が行える様奇数番目にシフ 卜させる。 次にステップ 29に於いて 4 ビ ッ 卜の音声データを 12ビッ 卜に伸張する。 伸張アルゴリズムと して は、 例えば次の通り とする。 初回データ (Y ) は 0 レベル(808 h ) で計算し、 2回目以降は下記計算で得られたデータを前回データと して用いる、 4 ビッ ト音声データ (X ) を基準値から引き、 掛け率 ( m ) をかける 12ビッ ト前回データ (Y ) を加算し 12ビッ ト音声デ 一タ ¾ "求 る。
12ビッ ト音声データ = ( ( X—基準値) * m ) + Y
ただし、 無音声後は前回データを 0 レベルとする。
尚、 12ビッ 卜に伸張している理由は、 音声のデジタル化を 12ビッ 卜で行った為であって、 上述のアルゴリズムと共に特に限定するも のではない。 又掛け率 (m ) は復元時に正確さを増す為に記録時に データ上に付加したものであり、 特に必要という ものでもない。 次 にステツプ 30にて音声データが奇数番目の時を検出し、 奇数番目の 時だけ音声データが終了するかどうかチェ ックが行われる。 これは 例えば音声データ全体に対応するフラグを一 1 (デク リ メ ン ト) し ていき、 0 になった時ステツプ 24で終了させる為の動作をさせるも のである。 尚、 発話スピー ドを制御する為に設定されるパラメータ 乃至パラメータに対する動作は、 上述に限るものではなく、 割り込 み等その他の手法によって実施されるものである。 更にパラメータ の発生に於いても、 予めその値を記憶設定しておき外部より入力が あった時そのパラメータが読みだされ、 そのパラメータに従って発 話スピー ドが設定されるようにしたもの、 或は、 外部入力時に、 そ の外部入力を読み取ってその入力に基づいて発話スピー ドを制御す る様にしたもの等その構成、 動作は適宜選択されるものである。 又 その処理様式は、 ソフ トウエアによるものに限らずハ一ドウエアに よるものであっても良い。 上述した実施例を使用して構成させる装 置の大きさは、 携帯型ができる程度が好ま しく、 学習書であれば、 音声をリ ピー ト出力する機能や、 しおり的な機能を付加する場合も ある。 又、 装置の大きさは、 記録媒体の大きさにも左右されること から、 記録媒体は、 小さ くてしかも高容量であるもの、 例えば CD— ROM 、 ミ ニ光磁気ディ スク、 3. 5イ ンチフロ ッ ピィ ディ スク、 デジ タルオーディオテープ等が適当であるが限定されるものでは無い。 尚、 ディ ジタル音声は、 自然音声を A / D変換、 圧縮処理した音 声等、 特に限定する必要はなく、 その他既存の方式によって変換さ れた音声を示すものである。
次に本発明における記録手段の他の具体例の構成を図 9を参照し ながら説明する (91 ) は音声入力手段であり、 アナログ音声電信号 を生成するマイ ク ロフォ ン、 フィ ルタ回路、 増幅回路等で構成され o
(92) は、 A Z D変換手段であって、 サンプリ ング回路、 A Z D コンバータ回路等で構成され、 更に ADPCM 等の各種 PCM, PWM, ATC 等の圧縮機能を含む回路を必要に応じて備えるものである。
(93) は、 無音声検出手段であって、 ディ ジタル音声データより 予め設定した無音を示すコー ド、 持続時間等を示すパラメ一タコー ド等とまぎらわしい値を示すデータを変更、 削除、 移動等して処理 した後、 無音声部を検出し、 この部分を無音声を示すコー ド、 時間 幅等を示すパラメータコー ドに対応させ、 音声データ中に割り込ま せるように付加する。
(94) は、 無音声削除手段であり、 無音声制御コー ドに続く無音 区間バイ ト数分の音声ディ ジタルデータ上から削除する為の手段で ある。
(95) は、 成分制御コー ド変換手段であり、 アナログ音声をデジ タル音声に変換させる際、 及び復元する際、 12ビッ 卜の変換手段を 使用し、 記録媒体には、 4 ビッ トデータを記録する仕様を採ってい るので、 該成分制御コ一ドは、 12ビッ トから 4 ビッ ト又は、 その逆 の変換処理を行う際その変換パラメータと して使用するものである またディ ジタル音声信号の変化率の大きい部分や特徴となる部分を 成分制御コー ドに変換する為の手段でもある。 成分制御コー ド変換 手段 (95) は、 音声信号の変化率の大きい部分や特徴となる部分は 通常ディ ジタル情報を大きく しないと充分な復元ができないことか ら、 この部分のデータを、 量、 数を示すデータ、 つまり成分制御コ ― ドに置き換えることによってディ ジタル情報量を少なく抑えると 共に、 記録媒体に記録する音声データが 4 ビッ ト程度と小さいビッ ト数に抑える場合、 再生時、 現波形に近いアナログ音声信号を得る ためのものである。
( 96) は、 組み替え手段であり、 所定区間で無音制御コー ド等の 制御コー ドと音声データを混在化している場合、 無音制御コ一 ド部 分を無音を示す音声データに置き換え、 次の区間の先頭にその制御 コー ドを格納するものである。 所定区間での音声データと制御コー ドの混在の状態とは、 例えば、 CPU 等の処理手段が 8 ビッ 卜の処理 能力があり、 処理しやすいように音声データ列を 8 ビッ 卜で区切る 様な場合であって、 この 8 ビッ ト中に音声データと制御データが在 る状態等である。
この様な状態に於いて、 下位 4 ビッ 卜のコー ドを次の所定区間の 先頭に置き、 代わりに無音声を示す音声データを代入する処理を施 し、 コー ドと音声データとを区別するものとする。 更に組み替え手 段では、 ディ ジタル音声を 4 ビッ ト符号化する手段も併せ有する。
( 97) は記録信号調整手段であって、 記録媒体に書き込む為に必 要な形態の信号を入力信号に対し変更処理させる為の手段である。 この場合、 EFM 変調など、 従来利用されている手段も含まれるもの とする。
(97p ) は書き込み用ピッ クアップであり、 記録媒体 (98) の種 類に応じて適宜選択される。 無音声検出手段 (93) へ記録信号調整 手段 (96) は、 1乃至複数の DSP 、 マイコンによって構成されるが その選択は装置の大小、 処理能力の大きさ等々によって適宜選択さ
¾しる c
次に図 9 における無音声削除手段 (94) における操作手順を図 11 及び図 12に示すフローチヤ一 トを参照しながら説明する即ち図 11に おいて無音声検出手段 (93) にて無音声符号等が音声データと一緒 になった混成データ列は、 無音声削除処理手段 (94) に入力され、 無音声を示す音声データが削除される。
ステップ ( 3 a ) に於いて無音声検出手段 (93) から直接または バッファ等を介して間接的に該混成データが読み込まれる。
ステップ ( 3 b ) にて、 最初のデータが無音検出制御コー ドであ るか判定される。 無音検出制御コー ドであれば (yes)、 次のステツ プ ( 3 d ) へ進む。 もしそうでなければ、 (no) となり強制的に無 音検出制御コー ドと無音区間バイ ト数 0をバッ フ ァメモリ に格納し 、 ステップ ( 3 d ) へ進む。 ステップ ( 3 d ) では、 全データが処 理を終了したかどうか判定し、 しない場合 (no) 、 改めて混成デ一 タ列を読み込む。
次にステップ (3 f ) にて、 無音検出制御コー ドであるかないか を判定し、 そうである (yes)時、 ステップ (3 h) にて無音検出制 御コー ドと無音区間を示すバイ ト数のみ格納し、 そのままスキップ する。 更にステップ ( 3 i ) にて無音検出制御コー ドに対応した無 音区間バイ ト数分のデータのポイ ンタを進め、 無音区間バイ ト数分 データを削減する。 ステップ ( 3 f ) にて、 無音検出制御コー ドで ない (no) 場合、 読み込まれたデータがこの部分は音声データであ ると決定し、 データをバッフ ァに格納する。 以上の繰り返しを行う こ とによって、 全データを音声データと無音検出制御コ一ドと無音 区間バイ ト数コー ドだけのデータ列に整理する。 逐次乃至一定量削 除処理を行った後、 無音声削除手段 (94) の出力は、 成分制御コー ド変換手段 (95) に入力される。
次に図 12においてステップ ( 4 a ) に於いて無音声削除手段 (94) が出力したデータを読み込む。 尚この実施例での説明では、 読み込 むデータの単位は 256個と し、 1個単位で処理されることと した。
ステップ ( 4 b ) に於いて、 処理データが無音検出制御コ一 ドで あるか、 ないかを判定し、 制御コー ドであるとき (yes)、 無音検出 制御コー ドと無音区間バイ ト数のみをバッファに格納し、 そのまま データをスキップさせステップ ( 4 d )' に移行する。 無音検出制御 コー ドでない場合ステップ ( 4 d ) に移行する。 ステップ ( 4 d ) に於いて、 前データと現データとの差を求めて、 その差分データか ら同一モー ドでの差データの最大値を求める。 ステップ ( 4 d ) に 於て、 モー ドの変更があるかどうか判定し、 モー ド変更があった場 合 (yes)、 ステップ ( 4 e ) へ移行する。 同一モー ドの場合 (no) は、 ステップ ( 4 a ) へ移行し、 次のデータの処理を行う。 ステツ プ ( 4 e ) に於て、 モー ド変更が、 プラス · マイナス成分モー ドへ の変更であるか判定を行う。 プラス · マイナス成分モー ドとは、 図 13 ( A) 〜 ( C) で示される様に、 データの変化が少なく、 プラス とマイナス成分が有り、 隣在ったデータの差が規定値以下のデータ である。
ステップ ( 4 e ) でプラス ' マイナス成分モー ドに該当する時は (yes)方向へ行き、 該当しない場合は (no) へ行く。 (yes)の場合 は、 プラス · マイナス成分モー ドに対応するプラス · マイナス制御 コー ド並びに掛け率コー ドを音声符号データ上に格納する。 掛け率 コ一 ドとは、 音声データの変化量に於けるビッ ト表現では不充分な 部分を補う ものであり、 掛け率によって音声データ変化量を表現す るものである。 掛け率コー ドの基準は、 任意であって音声データの ディ ジタルビッ ト表現、 サンプル周波数によって適宜選択される。 尚、 サンプル周波数 8 KHz 、 記録媒体に記録される音声並びに制 御コ一 ドディ ジタルデータが 4 ビッ 卜の場合の掛け率は例えば、 次 の様に設定される。 プラス ' マイナスの方向性は、 7 を基準値と し 0〜 6 までがマイナス成分、 8〜14(Eh)までがブラス成分を現す。 この時の最大変化量は 7である。 最大差 (B) (図 13 (A))最大変化 量で 1変化の掛け率を求める。
ステップ ( 4 e ) で (no) の時、 ステップ ( 4 g) へ移行し、 プ ラス成分モー ド上での差分データの一致、 不一致を判定し、 一致す る際、 プラス成分モー ドと対応するプラス制御コー ド並びに掛け率 を音声データ上に格納する。 この時の掛け率は例えば次の様に設定 される。 0を基準値と し 1 〜14(Eh)で現されることから最大変化量 は 14に設定される。
次に掛け率 (最大差 最大変化量) の演算を行い 1 変化あたりの 掛け率を求める。 ステップ ( 4 h) にて、 音声データに於いて、 プ ラス成分モー ドで検知された部分にプラス制御コー ドと掛け率を格 納する。
ステップ ( 4 g) にて、 (no) の場合、 ステップ ( 4 i ) でマイ ナス制御コー ド、 掛け率を音声データ上の該当する個所へ格納する c マイナス成分の掛け率は、 方向性を示すデータは必要とせず、 14を 基準値と してり〜 13(Dh)で表す。 最大変化量は 14で (最大差 最大 変化量) で 1変化あたりの掛け率を求める。
以上の様に音声データと成分掛け率制御コ一 ド無音声制御が混在 化したデータは、 組み替え手段 (96) に入力される。 組み替え手段 (96) は、 この混在化データに対し、 音声データを 12ビッ トを 4 ビ ッ 卜へ符号化、 並びに音声データと制御コー ドの組み替えを行う。 又、 第 9図における組み替え手段 (96) の操作手段についてフロ 一チャー ト (図 14) を参照しながら説明する。
ステップ ( 6 a ) に於いて、 データを読み込み、 そのデータの所 定数ずつ区切って処理する。 ステップ ( 6 b ) に於いて、 制御コー ドであるかないかを判断し、 制御コー ドでない (no) の時、 音つま り音声データである時、 4 ビッ 卜の符号化をステップ ( 6 c ) にて 行う。 この時、 成分と掛け率情報をもとに 4 ビッ トの符号化を行う 場合もある。 12ビッ トカ、ら 4 ビッ 卜への 1変換方法例について説明 "5 る。
初回 (n — : I ) では、 0 レベル(808h ) で計算をし、 2回目以降 は、 下記計算で得られたデータを前回データと して用いる。
データの差を掛け率 (m) で割り、 この差に必要な変化値を得る c 方向付けを行う為成分別の基準値を加算し 4 ビッ 卜の音声データ を得る。
4 ビッ ト音声データ = (((n ) 一 ( n - 1 ))/m) +基準値 成分と掛け率は、 前段で示した制御コー ド変換手段 (95) で決定さ れたものであって、 成分制御コー ド、 掛け率は書き換えが発生する 迄、 書き換え前の符号が有効とされる。
ステップ ( 6 c ) で 4 ビッ ト化された音声データが偶数番目か奇 数番目かを判定し、 偶数番目の場合 (yes:)、 上位 4 ビッ 卜 レジスタ に符号化データを退避させる。 奇数番目の場合 (no) 、 下記 4 ビッ ト レジスタに符号化データを退避させる。 上位と下位それぞれが収 まつた所でステップ ( 6 g ) で上位 4 ビッ ト、 下位 4 ビッ ト合計 1 バイ トの符号化データをバッ フ ァメモリ に格納する。 ステップ ( 6 b ) でデータが制御コー ドである時、 この時点でステップ ( 6 h ) にて音声データが奇数データ終了かどうか判定する。 奇数 データ終了の時 (yes:)、 制御コー ド部に無音声を示す音声を格納し、 あわせて次の上位 4 ビッ 卜に制御コー ドを格納する。 ステップ ( 6 j ) にて制御コ一 ド (Fh) に付随する成分制御コー ド (種類、 掛け率等) を追加格納する。 ステップ ( 6 h ) にて音声データが偶 数で終了する場合は (no) 、 上述したステップ ( 6 j ) の処理を行 う ものである。 以上の様に音声データと制御コー ドが整理されたデ —タは、 記録信号調整手段 (97) 、 書き込み用ピックアップ (97 P ) を介して仮のあるいは主体となる記録媒体 (18) に書き込まれる。 以上詳述の如く本発明は、 一般に提供されている記録媒体であつ ても書籍の朗読音声を充分な時間再生でき、 しかも再生時、 発話速 度を可変自在と し、 且つ通常の朗読と変わらない音声を出力させる ことができる等の効果を有する。
つまり本発明は、 鋭意研究の結果、 実質的に無音声部を符号化し た様式でディ ジタル音声データを記憶媒体に記憶させ、 再生時、 こ の無音声時間を付加することにより、 記憶媒体には、 充分な音声デ
—夕が格納でき、 しかも再生時この符号には、 元の無音声部分の情 報が含まれていることから自然の朗読に近い状態の音声出力が長時 間得られ、 しかも所望時間幅を有する無音声データを任意に付加で きることから、 学習書、 解説書等のようにゆっ く り聞きたい時や、 早く聞きたい時等、 朗読スピー ドが可変可能な音声再生装置を実現 した。

Claims

請 求 の 範 囲
1 . 音声信号に含まれる無音声部分を所定の無音声部分表示デー 夕信号に変換して記憶した音声信号記憶手段、 記憶された音声信号 を所望の発話速度で再生する音声再生手段とから構成されている事 を特徴とする音声再生装置。
2 . 入力される音声信号に含まれる無音声部分を所定の無音声部分 表示データ信号に変換する無音声部分表示変換手段、 当該無音声部 分表示変換手段により変換された該無音声部分表示データ信号を含 む入力音声信号を記憶する記憶手段とから構成されている事を特徴 とする音声記録再生装置。
3 . 入力される音声信号に含まれる無音声部分を所定の無音声部 分表示データ信号に変換する無音声部分表示変換手段、 当該無音声 部分表示変換手段により変換された該無音声部分表示データ信号を 含む入力音声信号を記憶する記憶手段、 及び当該記憶手段に記憶さ れた入力音声信号を所望の発話速度で再生する音声再生手段とから 構成されている事を特徵とする音声記録再生装置。
4 . 該音声再生手段による音声再生に際して、 当該発話速度を調 整する為の調整手段が更に設けられている事を特徵とする請求の範 囲第 1項乃至第 3項の何れかに記載の音声記録再生装置。
5 . 当該無音声部分表示変換手段に於ける該無音声部分表示デ— タ信号は、 当該無音声部分を削除する信号である事を特徴とする請 求の範囲第 1項乃至 4項のいずれかに記載の音声記録再生装置。
6 . 当該無音声部分表示変換手段に於ける該無音声部分表示デ— タ信号は、 当該無音声部分の時間に関する情報を示す信号である事 を特徴とする請求の範囲第 1項乃至 4項のいずれかに記載の音声記 録再生装置。
7 . 当該無音声部分表示変換手段に於ける該無音声部分表示デー タ信号は、 当該無音声部分が配置されている当該入力音声信号内の 位置を表す情報を示す信号である事を特徴とする請求の範囲第 1 項 乃至 4項のいずれかに記載の音声記録再生装置。
8 . 当該無音声部分表示変換手段により出力された、 複数の該無 音声部分表示データ信号は、 該記憶手段に於ける所定の位置に集中 して記憶させるものである事を特徴とする請求の範囲第 1 項乃至 7 項のいずれかに記載の音声記録再生装置。
9 . 当該音声再生手段は、 該入力音声信号を再生するに際し、 当 該記憶手段に記憶された当該無音声部分表示データ信号を、 当該無 音声部分表示データ信号に付与されている所定の情報に従って、 当 該入力音声信号群列の所定の位置に挿入しながら再生する事を特徴 とする請求の範囲第 1 項乃至 8項のいずれかに記載の音声記録再生 装置。
PCT/JP1994/000661 1993-04-21 1994-04-21 Apparatus for recording and reproducing voice WO1994024667A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP94913792A EP0652560A4 (en) 1993-04-21 1994-04-21 DEVICE FOR RECORDING AND PLAYING BACK VOICE.
KR1019940704661A KR950702323A (ko) 1993-04-21 1994-12-20 음성 기록/재생 장치(apparatus for recording and reproducing voice)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP5/116599 1993-04-21
JP5116599A JPH06308992A (ja) 1993-04-21 1993-04-21 音声式電子ブック

Publications (1)

Publication Number Publication Date
WO1994024667A1 true WO1994024667A1 (en) 1994-10-27

Family

ID=14691150

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1994/000661 WO1994024667A1 (en) 1993-04-21 1994-04-21 Apparatus for recording and reproducing voice

Country Status (3)

Country Link
JP (1) JPH06308992A (ja)
KR (1) KR950702323A (ja)
WO (1) WO1994024667A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996007999A1 (en) * 1994-09-05 1996-03-14 Ellen Rubin Lebowitz Reading tutorial system

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020663B2 (en) 2001-05-30 2006-03-28 George M. Hay System and method for the delivery of electronic books
JP6389348B1 (ja) * 2018-03-23 2018-09-12 株式会社アセンド 音声データ最適化システム
JP6386690B1 (ja) * 2018-06-27 2018-09-05 株式会社アセンド 音声データ最適化システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59195307A (ja) * 1983-04-20 1984-11-06 Casio Comput Co Ltd 音声情報記録方式
JPS6035795A (ja) * 1983-08-05 1985-02-23 赤井電機株式会社 信号のピツチ変換器
JPS62125577A (ja) * 1985-11-26 1987-06-06 Nec Corp 音声蓄積再生装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03184171A (ja) * 1989-12-13 1991-08-12 Hitachi Ltd 電子ブック再生装置
JPH03248398A (ja) * 1990-12-13 1991-11-06 Sharp Corp デイジタル録音再生機の録音再生方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59195307A (ja) * 1983-04-20 1984-11-06 Casio Comput Co Ltd 音声情報記録方式
JPS6035795A (ja) * 1983-08-05 1985-02-23 赤井電機株式会社 信号のピツチ変換器
JPS62125577A (ja) * 1985-11-26 1987-06-06 Nec Corp 音声蓄積再生装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996007999A1 (en) * 1994-09-05 1996-03-14 Ellen Rubin Lebowitz Reading tutorial system

Also Published As

Publication number Publication date
JPH06308992A (ja) 1994-11-04
KR950702323A (ko) 1995-06-19

Similar Documents

Publication Publication Date Title
JP2965330B2 (ja) 情報再生装置
JPH10187199A (ja) 半導体記憶媒体記録装置及び半導体記憶媒体再生装置
KR100291612B1 (ko) 데이터유니트의 오리지널시퀀스편집방법및그장치
WO1994024667A1 (en) Apparatus for recording and reproducing voice
JPH0689544A (ja) ディスク記録装置
JP4990375B2 (ja) 記録再生装置
EP0652560A1 (en) Apparatus for recording and reproducing voice
JP2838159B2 (ja) 音声信号処理装置
JPH09138698A (ja) 音声記録再生装置
JP4588626B2 (ja) 楽曲再生装置、再生制御方法、および、プログラム
US6373421B2 (en) Voice recording/reproducing device by using adaptive differential pulse code modulation method
JP3727689B2 (ja) ディジタル音声記録再生装置
JPH07160282A (ja) 音声再生装置
JPS6253093B2 (ja)
JPH0927189A (ja) 音声情報再生方式
JP3341348B2 (ja) 情報検出再生装置及び情報記録装置
JP3490655B2 (ja) オーディオ信号復号器
JP2001117596A (ja) 音声信号再生方法および音声信号再生装置
JPH08255430A (ja) ディスク記録再生装置
JP3829944B2 (ja) 再生装置
JP4264670B2 (ja) 記憶再生装置及び記憶再生方法
JPH07153188A (ja) 音声再生装置
JPS60146297A (ja) 音声レコ−ダ
JPH07169291A (ja) 音声記録装置及び音声再生装置
JPH03182799A (ja) 音声情報記録装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL PT SE

ENP Entry into the national phase

Ref country code: US

Ref document number: 1994 356324

Date of ref document: 19941220

Kind code of ref document: A

Format of ref document f/p: F

WWE Wipo information: entry into national phase

Ref document number: 1994913792

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1994913792

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 1994913792

Country of ref document: EP