JP2000259181A - Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded - Google Patents

Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded

Info

Publication number
JP2000259181A
JP2000259181A JP11063630A JP6363099A JP2000259181A JP 2000259181 A JP2000259181 A JP 2000259181A JP 11063630 A JP11063630 A JP 11063630A JP 6363099 A JP6363099 A JP 6363099A JP 2000259181 A JP2000259181 A JP 2000259181A
Authority
JP
Japan
Prior art keywords
information
speech
voice
recognition
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11063630A
Other languages
Japanese (ja)
Inventor
Hiroshi Koge
浩 高家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP11063630A priority Critical patent/JP2000259181A/en
Publication of JP2000259181A publication Critical patent/JP2000259181A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a speech information recognition device, etc., capable of targeting a speech-recognizable part for speech recognition even in the case that speech data differing in compression ratio co-exist in one speech file. SOLUTION: This is a speech information recognition device configured of a personal computer 4 comprising a speech recognition program 9 converting speech information stored in a speech file in predetermined block units into character information by speech-recognizing each block, a control program 8 which checks a compression ratio of the speech information in each block and judges it to be suitable for speech recognition when the compression ratio is smaller than a predetermined one, judges it not to be suitable for speech recognition when the compression ratio is larger the predetermined one, and is made to execute speech recognition and its conversion into character information only when the compression ratio is judged to be suitable for speech recognition, and a display 5 for displaying unsuitableness and giving a warning when the compression ratio is judged to be unsuitable for speech recognition.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声情報認識装
置、音声情報認識方法、音声情報の認識をするためのプ
ログラムを記録した記録媒体、より詳しくは、音声情報
を認識して文字情報に変換する音声情報認識装置、音声
情報認識方法、音声情報の認識をするためのプログラム
を記録した記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice information recognition device, a voice information recognition method, a recording medium on which a program for recognizing voice information is recorded, and more specifically, voice information is recognized and converted into character information. The present invention relates to a voice information recognition device, a voice information recognition method, and a recording medium storing a program for recognizing voice information.

【0002】[0002]

【従来の技術】近年、音声をディジタルデータに変換し
て音声ファイルとしてフラッシュメモリカード等に記録
するディジタルレコーダが製品化されている。
2. Description of the Related Art In recent years, digital recorders have been commercialized that convert voice into digital data and record it as a voice file on a flash memory card or the like.

【0003】このようなディジタルレコーダは、音声フ
ァイルを記録する際に、情報量を小さくするために符号
化を行うようにしているが、このときの圧縮率として、
比較的圧縮率の低いSP(スタンダードプレイ)モード
と、比較的圧縮率の高いLP(ロングプレイ)モードと
を設けたものがある。このように複数の録音モードを設
けることによって、音質を重視する際にはSPモードを
用い、録音時間を重視する際にはLPモードを用いるな
どの必要に応じた使い分けが可能となる利点を有してい
る。
[0003] Such a digital recorder performs encoding in order to reduce the amount of information when recording an audio file.
Some models are provided with an SP (standard play) mode having a relatively low compression ratio and an LP (long play) mode having a relatively high compression ratio. Providing a plurality of recording modes in this way has the advantage that the SP mode can be used when sound quality is emphasized, and the LP mode is used when sound recording time is emphasized. are doing.

【0004】音声ファイルは、例えば512バイトのサ
イズでなるブロックを単位として記録されるようになっ
ており、録音モードは該ブロック毎に変更することが可
能である。
[0004] An audio file is recorded in units of blocks each having a size of, for example, 512 bytes, and the recording mode can be changed for each block.

【0005】一方で、音声を認識して文字情報に変換す
る技術は、従来より研究されていたが、近年では、パー
ソナルコンピュータ等の情報機器におけるソフトウェア
として製品化されており、実用化の段階に達している。
On the other hand, techniques for recognizing speech and converting it to character information have been studied in the past, but in recent years, it has been commercialized as software for information devices such as personal computers, and is in the stage of practical use. Has reached.

【0006】このような音声認識の技術を、上述したよ
うなディジタルレコーダによって録音された音声ファイ
ル内の音声データに適用する場合には、認識率の低下を
避けるために、対象となる音声データの品質をある程度
以上のレベルに制限する必要があり、上述したような録
音モードの例においては、SPモードにより録音された
もののみを音声認識の対象として、LPモードにより録
音されたものは音声認識の対象から外すことが行われて
いる。
When such a speech recognition technique is applied to speech data in a speech file recorded by a digital recorder as described above, in order to avoid a decrease in the recognition rate, the speech recognition of the target speech data is performed. It is necessary to limit the quality to a certain level or more, and in the above-described recording mode, only the sound recorded in the SP mode is subjected to speech recognition, and the sound recorded in the LP mode is subjected to speech recognition. Exclusions have been made.

【0007】すなわち、従来の音声認識に係る技術にお
いては、SPモードのみにより録音された音声ファイル
を音声認識の対象とし、その他の音声ファイルは音声認
識の対象外としており、音声認識を行うか否かは音声フ
ァイルを単位としたものであった。
That is, in the conventional speech recognition technology, a speech file recorded only in the SP mode is targeted for speech recognition, and other speech files are excluded from speech recognition. The unit was an audio file.

【0008】[0008]

【発明が解決しようとする課題】上述したようにSPモ
ードによる録音とLPモードによる録音は、音声ファイ
ルを構成するブロックを単位として行うことが可能であ
り、使用者が録音中に、記録媒体の残り容量が少なくな
ってきたと判断して、途中でSPモードからLPモード
に録音モードを切り換える、といった使い方をすること
が考えられる。
As described above, the recording in the SP mode and the recording in the LP mode can be performed in units of blocks constituting an audio file. It is conceivable that the recording mode is switched from the SP mode to the LP mode on the way, judging that the remaining capacity has become small.

【0009】このような場合には、1つの音声ファイル
内にSPモードにより記録されたブロックとLPモード
により記録されたブロックとが混在することになるが、
上述したような従来の技術では、このような音声ファイ
ルは音声認識の対象から外されてしまっていた。従っ
て、例え一部分であっても音声認識を行いたいと考える
使用者に対応することができなかった。
In such a case, a block recorded in the SP mode and a block recorded in the LP mode are mixed in one audio file.
In the above-described conventional technology, such a voice file is excluded from voice recognition. Therefore, even if it is a part, it cannot respond to a user who wants to perform speech recognition.

【0010】本発明は上記事情に鑑みてなされたもので
あり、一つの音声ファイル内に異なる圧縮率の音声デー
タが混在する場合でも、音声認識可能な部分については
音声認識の対象とすることができる音声情報認識装置、
音声情報認識方法、音声情報の認識をするためのプログ
ラムを記録した記録媒体を提供することを目的としてい
る。
The present invention has been made in view of the above circumstances, and even when voice data having different compression ratios are mixed in one voice file, a voice recognizable portion may be subjected to voice recognition. Voice information recognition device,
An object of the present invention is to provide a voice information recognition method and a recording medium on which a program for recognizing voice information is recorded.

【0011】[0011]

【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明による音声情報認識装置は、音声情報
を認識して文字情報に変換する変換手段と、所定の圧縮
率で符号化された音声情報を該圧縮率に応じて文字情報
に変換するかしないかを制御する制御手段とを備えたも
のである。
In order to achieve the above object, a speech information recognition apparatus according to a first aspect of the present invention includes a conversion means for recognizing speech information and converting it to character information, And control means for controlling whether or not the converted audio information is converted into character information in accordance with the compression ratio.

【0012】また、第2の発明による音声情報認識装置
は、上記第1の発明による音声情報認識装置において、
上記制御手段が、音声情報の圧縮率が音声認識に適した
レベルにあるときは上記変換手段に音声認識を行わせて
音声情報を文字情報に変換させ、音声情報の圧縮率が音
声認識に適さないレベルにあるときは所定の警告信号を
出力するものである。
Further, the speech information recognition device according to the second invention is the speech information recognition device according to the first invention,
When the compression rate of the speech information is at a level suitable for speech recognition, the control means causes the conversion means to perform speech recognition to convert the speech information into character information, and the compression rate of the speech information is suitable for speech recognition. When the level is not present, a predetermined warning signal is output.

【0013】さらに、第3の発明による音声情報認識装
置は、上記第1または第2の発明による音声情報認識装
置において、音声ブロック毎に文字情報に変換するかし
ないかの制御を行うものである。
Further, a voice information recognition device according to a third aspect of the present invention controls the voice information recognition device according to the first or second aspect of the present invention to determine whether or not each voice block is converted into character information. .

【0014】第4の発明による音声情報認識方法は、所
定の圧縮率で符号化された音声情報を該圧縮率に応じて
文字情報に変換するかしないかを制御し、文字情報に変
換するという制御がされたときには音声情報を認識して
文字情報に変換させるものである。
A speech information recognition method according to a fourth aspect of the present invention controls whether speech information encoded at a predetermined compression rate is converted into character information in accordance with the compression rate, and converts the information into character information. When the control is performed, the voice information is recognized and converted into character information.

【0015】第5の発明による音声情報の認識をするた
めのプログラムを記録した記録媒体は、コンピュータに
よって音声情報の認識をするためのプログラムを記録し
た記録媒体であって、該プログラムは、コンピュータ
に、所定の圧縮率で符号化された音声情報を該圧縮率に
応じて文字情報に変換するかしないかを制御させ、文字
情報に変換するという制御がされたときには、音声情報
を認識して文字情報に変換させるものである。
According to a fifth aspect of the present invention, a recording medium storing a program for recognizing voice information is a recording medium storing a program for recognizing voice information by a computer. If it is controlled to convert audio information encoded at a predetermined compression rate into character information according to the compression rate, and to convert the information to character information, the audio information is recognized and the character It is converted into information.

【0016】[0016]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1から図7は本発明の一実施形
態を示したものであり、図1はディクテーションシステ
ムの全体的な構成を示す図である。
Embodiments of the present invention will be described below with reference to the drawings. 1 to 7 show an embodiment of the present invention, and FIG. 1 is a diagram showing an overall configuration of a dictation system.

【0017】このディクテーションシステムは、図1に
示すように、音声を電気信号に変換して音声データ化
し、低圧縮率のSP(スタンダードプレイ)モードまた
は高圧縮率のLP(ロングプレイ)モードにより記録す
るディジタルレコーダ1と、このディジタルレコーダ1
に着脱可能に装着して用いられるものであって上記音声
データを記録する記録媒体たるミニチュアカード2と、
このミニチュアカード2を後述するPCカードスロット
10(図2参照)に挿入して接続可能とするためのPC
カードアダプタ3と、警告手段たるディスプレイ5や入
力を行うためのキーボード6,マウス7等を備え、上記
PCカードスロット10を介して上記ミニチュアカード
2から得た音声データに、制御プログラム8や音声認識
プログラム9による処理を施す音声情報認識装置たるパ
ーソナルコンピュータ4とを有して構成されている。
As shown in FIG. 1, the dictation system converts sound into an electric signal and converts it into sound data, which is recorded in a low compression rate SP (standard play) mode or a high compression rate LP (long play) mode. Digital recorder 1 and the digital recorder 1
A miniature card 2 which is used by being detachably mounted on the card and is a recording medium for recording the audio data;
A PC for inserting the miniature card 2 into a PC card slot 10 (see FIG. 2) described later to enable connection.
A card adapter 3, a display 5 as a warning means, a keyboard 6 for inputting, a mouse 7 and the like are provided, and a control program 8 and a voice recognition program are added to voice data obtained from the miniature card 2 through the PC card slot 10. And a personal computer 4 as a voice information recognition device for performing the processing by the computer 9.

【0018】次に、図2は上記パーソナルコンピュータ
4の電気的な構成を示すブロック図である。
FIG. 2 is a block diagram showing an electrical configuration of the personal computer 4. As shown in FIG.

【0019】このパーソナルコンピュータ4は、上記制
御プログラム8に従って音声再生や情報表示等を行い、
また上記音声認識プログラム9に従って音声情報を認識
して文字情報に変換する処理等を行うとともに、その他
の各種のプログラムに応じて様々な処理を行うものであ
り、変換手段、制御手段、音声認識手段を兼ねたCPU
11と、このCPU11の作業領域となる記録媒体たる
メインメモリ12と、例えばハードディスク等でなり上
記制御プログラム8や音声認識プログラム9が記録され
ている記録媒体たる内部記録媒体13と、各種の外部機
器に接続するための外部ポート14と、上記ディスプレ
イ5を接続するインターフェース(以下、IFと略す)
15と、上記キーボード6やマウス7を接続するIF1
6と、音声データに基づいて音声を発するスピーカ18
と、このスピーカ18を接続するIF17と、上記PC
カードアダプタ3に装着されたミニチュアカード2が挿
入されるPCカードスロット10と、このPCカードス
ロット10を接続するためのIF19と、を有して構成
されていて、上記CPU11、メインメモリ12、内部
記録媒体13、外部ポート14、IF15,16,1
7,19は、バスを介して互いに接続されている。
The personal computer 4 reproduces sound and displays information according to the control program 8.
In addition to performing processing for recognizing voice information and converting it to character information in accordance with the voice recognition program 9, various processing is performed in accordance with other various programs. CPU that doubles as
11, a main memory 12 as a recording medium serving as a work area for the CPU 11, an internal recording medium 13 such as a hard disk or the like in which the control program 8 and the voice recognition program 9 are recorded, and various external devices. And an interface (hereinafter abbreviated as IF) for connecting the display 5 to the external port 14 for connecting to the display 5.
15 and an IF1 for connecting the keyboard 6 and the mouse 7
6 and a speaker 18 for emitting sound based on the sound data
And an IF 17 for connecting the speaker 18 and the PC
It comprises a PC card slot 10 into which the miniature card 2 attached to the card adapter 3 is inserted, and an IF 19 for connecting the PC card slot 10 to the CPU 11, the main memory 12, and the internal recording. Medium 13, external port 14, IFs 15, 16, 1
7, 19 are connected to each other via a bus.

【0020】なお、音声データは、上記PCカードスロ
ット10を介してミニチュアカード2から直接読み込む
ようにしても良いが、一旦、上記内部記録媒体13に記
録して、この内部記録媒体13から読み出すようにして
も良いし、あるいは、ディジタルレコーダ1から赤外線
やシリアル、USB等の通信手段を介して直接読み込む
ようにしても構わない。
The audio data may be directly read from the miniature card 2 via the PC card slot 10. However, the audio data is temporarily recorded on the internal recording medium 13 and read from the internal recording medium 13. Alternatively, the information may be directly read from the digital recorder 1 via communication means such as infrared, serial, or USB.

【0021】また、上記制御プログラム8や音声認識プ
ログラム9は、出荷時に予め内部記録媒体13に記録し
ておいても良いが、汎用のパーソナルコンピュータの場
合には、これらのプログラムが記録されたフロッピーデ
ィスクやCD−ROM、DVD−ROMなどの記録媒体
から、内部記録媒体13にインストールするようにして
も良い。このときには、これらフロッピーディスク、C
D−ROM、DVD−ROM等が、音声情報の認識をす
るためのプログラムを記録した記録媒体を構成すること
になる。
The control program 8 and the voice recognition program 9 may be recorded in the internal recording medium 13 before shipment, but in the case of a general-purpose personal computer, the floppy disk on which these programs are recorded is stored. The recording medium such as a disk, CD-ROM, or DVD-ROM may be installed in the internal recording medium 13. At this time, these floppy disks, C
A D-ROM, a DVD-ROM, or the like constitutes a recording medium on which a program for recognizing audio information is recorded.

【0022】図3は、上述したようなディクテーション
システムにおける音声ファイルの構造を示すブロック図
である。
FIG. 3 is a block diagram showing the structure of an audio file in the dictation system as described above.

【0023】この音声ファイルは、例えばDSSという
タイプのファイル構造を有するものとして構成されてい
る。
This audio file has a file structure of, for example, DSS type.

【0024】すなわち、音声ファイルは、図3(A)に
示すように、例えば512バイトのサイズでなるブロッ
クを単位として構成されていて、その内の先頭の例えば
2ブロックがファイルヘッダとなっており、残りの部分
が音声データが記録されているブロックである。
That is, as shown in FIG. 3A, the audio file is configured in units of blocks each having a size of, for example, 512 bytes, and the first two blocks, for example, are used as a file header. , And the rest are blocks in which audio data is recorded.

【0025】上記ファイルヘッダには、例えばブロック
ヘッダ数、自己認識フラグ、システムバージョン番号、
システムリリース番号、ライセンスIDコード、ユーザ
IDコード、ジョブ番号コード、使用目的種別コード、
工程管理コード、状態管理コード、録音開始日時、録音
終了日時、録音時間、誤消去防止フラグ、優先度レベ
ル、送り先IDコード、複数のIマークアドレス、予備
領域、管理コード領域、ファイルテキスト基本領域、フ
ァイルテキスト予備領域等が設けられている。
The file header includes, for example, the number of block headers, a self-recognition flag, a system version number,
System release number, license ID code, user ID code, job number code, purpose code,
Process management code, status management code, recording start date and time, recording end date and time, recording time, erroneous erasure prevention flag, priority level, destination ID code, multiple I mark addresses, spare area, management code area, file text basic area, A file text spare area and the like are provided.

【0026】上記音声データは、音声情報ブロックであ
るDSSブロックを1つ以上有して構成されている。こ
れら各DSSブロックには、図3(B)に示すように、
先頭にDSSブロックヘッダが設けられており、その他
の部分にフレーム単位で音声データが記録されている。
The audio data has one or more DSS blocks, which are audio information blocks. Each of these DSS blocks has, as shown in FIG.
A DSS block header is provided at the beginning, and audio data is recorded in other parts in frame units.

【0027】上記DSSブロックヘッダには、該DSS
ブロックに記録される音声データが、上記SP(スタン
ダードプレイ)モードにより低圧縮率で記録されたもの
か、あるいはLP(ロングプレイ)モードにより高圧縮
率で記録されたものかを判別するための情報が記録され
ている。
The DSS block header includes the DSS
Information for determining whether the audio data recorded in the block is recorded at a low compression rate in the SP (standard play) mode or is recorded at a high compression rate in the LP (long play) mode. Is recorded.

【0028】すなわち、この音声ファイルは、ブロック
を単位として、SPモードによる録音と、LPモードに
よる録音とを切り換えることが可能となっている。これ
により、音声ファイルの種類としては、SPモードのみ
のDSSブロックで構成されるものと、LPモードのみ
のDSSブロックで構成されるものと、SPモードによ
るDSSブロックとLPモードによるDSSブロックと
が混在して構成されるものとの3種類が存在する。
That is, this audio file can be switched between recording in the SP mode and recording in the LP mode in units of blocks. As a result, the type of the audio file includes a DSS block composed of only the SP mode, a DSS block composed of only the LP mode, and a DSS block composed of the SP mode and a DSS block composed of the LP mode. There are three types.

【0029】図4は、上述したようなパーソナルコンピ
ュータにおいて音声認識を行うときの動作を示すフロー
チャートである。
FIG. 4 is a flowchart showing the operation of the personal computer as described above when performing voice recognition.

【0030】動作が開始されると、PCカードスロット
10を介してミニチュアカード2に記録されている音声
ファイルの取り込みを行う(ステップS1)。そして、
ファイルシステムの管理領域や上記ファイルヘッダに記
録されている各ファイルのデータを読み込んで(ステッ
プS2)、読み込んだファイルデータに含まれているフ
ァイル名情報を、上記ディスプレイ5に一覧表示させる
(ステップS3)。
When the operation is started, an audio file recorded on the miniature card 2 is captured via the PC card slot 10 (step S1). And
The data of each file recorded in the management area of the file system and the file header is read (step S2), and the file name information included in the read file data is displayed on the display 5 as a list (step S3). ).

【0031】このときにディスプレイ5の画面には例え
ば図6に示すような表示が行われる。図6は、パーソナ
ルコンピュータにおいて音声認識を行うときの画面表示
の一例を示す図である。
At this time, for example, a display as shown in FIG. 6 is performed on the screen of the display 5. FIG. 6 is a diagram illustrating an example of a screen display when performing voice recognition in a personal computer.

【0032】この図6はメイン画面21を示しており、
ファイルに関する操作や編集に関する操作などを選択す
るためのメニューバー22と、各種の操作をアイコンを
用いて視覚的に分かり易く表示するツールボタンバー2
3と、上記ミニチュアカード2から転送された音声ファ
イルに係る各種のデータを表示する音声ファイルリスト
ボックス24と、再生や停止、早送りや早戻しなどの処
理を行うためのコントロールボタン25と、がそれぞれ
表示されていて、上記ツールボタンバー23には音声認
識処理を開始させるための音声認識ボタン26が設けら
れている。
FIG. 6 shows the main screen 21.
A menu bar 22 for selecting an operation related to a file or an operation related to editing, and a tool button bar 2 for displaying various operations in an easily understandable manner using icons.
3, an audio file list box 24 for displaying various data relating to the audio file transferred from the miniature card 2, and a control button 25 for performing processing such as play, stop, fast forward and fast reverse, respectively. The displayed tool button bar 23 is provided with a voice recognition button 26 for starting voice recognition processing.

【0033】上記音声ファイルリストボックス24に
は、ファイル名を一覧表示させる欄31と、録音時間を
表示させる欄32と、録音日時を表示させる欄33と、
音声認識を行うことができるか否かを確認するために録
音モードを表示させる欄34と、エンドマーク欄35と
が順に設けられており、上記ステップS2において読み
取ったファイルデータに基づいて、上記ステップS3で
表示するようになっている。
In the audio file list box 24, a column 31 for displaying a list of file names, a column 32 for displaying a recording time, a column 33 for displaying a recording date and time,
In order to confirm whether or not voice recognition can be performed, a field 34 for displaying a recording mode and an end mark field 35 are provided in order, and based on the file data read in step S2, The information is displayed in S3.

【0034】続いて、使用者により音声認識処理を行う
対象となるファイルが選択され、かつ、その選択された
ファイルについて音声認識を行う指示がなされるのを待
機する(ステップS4)。
Then, the process waits for the user to select a file to be subjected to the voice recognition process and to give an instruction to perform voice recognition on the selected file (step S4).

【0035】ここで、音声ファイルの選択は、上記図6
に示すように、上記音声ファイルリストボックス24内
の選択を行おうとする対象のファイル部分を、上記マウ
ス7等によりクリックすることで、反転表示がなされ、
選択されていることを視覚的に確認することができる。
Here, the selection of the audio file is performed according to FIG.
As shown in the figure, by clicking on the file portion to be selected in the audio file list box 24 with the mouse 7 or the like, the highlighted portion is displayed.
The selection can be visually confirmed.

【0036】そして、ファイルが選択されている状態に
おいて、上記音声認識ボタン26をマウス7等によりク
リックすることで、音声認識を行う指示入力がなされる
ようになっている。
When the voice recognition button 26 is clicked with the mouse 7 or the like while a file is selected, an instruction input for voice recognition is made.

【0037】こうして、上記ステップS4において、音
声ファイルが選択されて音声認識の指示が行われたこと
が確認された場合には、次に、その音声ファイルがSP
モードによる録音部分とLPモードによる録音部分とを
混合して有するファイルであるか否かを判断する(ステ
ップS5)。
If it is confirmed in step S4 that a voice file has been selected and a voice recognition instruction has been given, then the voice file is added to the SP file.
It is determined whether or not the file has a mixture of the recording part in the mode and the recording part in the LP mode (step S5).

【0038】ここで、混合ファイルでない場合には、S
Pモードのみにより録音された音声ファイルであるかを
判断し(ステップS6)、SPモードの音声ファイルで
ある場合には、該音声ファイル内の全音声データが音声
認識の対象となって、音声認識処理を行う(ステップS
8)。この音声認識が終了した場合には、上記ステップ
S4へ戻って、次のファイルが選択されるのを待機す
る。
Here, if the file is not a mixed file, S
It is determined whether the file is a voice file recorded only in the P mode (step S6). If the file is a voice file in the SP mode, all voice data in the voice file is subjected to voice recognition, and voice recognition is performed. Perform processing (step S
8). When the voice recognition has been completed, the process returns to step S4 to wait for the next file to be selected.

【0039】また、上記ステップS6において、音声フ
ァイルがSPモードのみにより録音された音声ファイル
でないと判断された場合には、LPモードのみにより録
音された音声ファイルであることになるために、該音声
ファイル内には音声認識の対象となる音声データが存在
しないことになる。従って、音声認識を実行することが
不可能である旨を上記ディスプレイ5に表示して(ステ
ップS7)、その後、上記ステップS4に戻って、他の
ファイルが選択されるのを待機する。
If it is determined in step S6 that the audio file is not an audio file recorded only in the SP mode, it is determined that the audio file is an audio file recorded only in the LP mode. There is no voice data to be subjected to voice recognition in the file. Accordingly, the fact that it is impossible to execute the voice recognition is displayed on the display 5 (step S7), and thereafter, the process returns to the step S4 to wait for another file to be selected.

【0040】一方、上記ステップS5において、SPモ
ードとLPモードによる録音部分が混合されたファイル
であると判断された場合には、一部に音声認識を実行す
ることができないところがある旨の警告表示を上記ディ
スプレイ5により行って(ステップS9)、念のため
に、処理をキャンセルするか否かを使用者に確認させる
(ステップS10)。
On the other hand, if it is determined in step S5 that the file is a file in which the recorded portions in the SP mode and the LP mode are mixed, a warning message indicating that there is a part where voice recognition cannot be performed is displayed. Is performed on the display 5 (step S9), and just in case, the user is asked whether to cancel the process (step S10).

【0041】ここで、処理をキャンセルすることが選択
された場合には、上記ステップS4に戻り、一方、処理
を行うことが選択された場合には、上記ステップS8へ
行って、音声ファイル中のSPモードで録音された部分
についてのみ音声認識処理を行う。
Here, if the cancellation of the process is selected, the process returns to the step S4. If the process is selected, the process proceeds to the step S8, and the process proceeds to the step S8. The voice recognition processing is performed only on the part recorded in the SP mode.

【0042】次に、図5は上記ステップS8の音声認識
処理の詳細を示すフローチャートである。
Next, FIG. 5 is a flowchart showing details of the voice recognition processing in step S8.

【0043】この動作が開始されると、音声認識を行う
対象のDSSブロックのDSSブロックヘッダ情報を読
み込んで(ステップS21)、該DSSブロックの録音
モード(圧縮モード)を判断する(ステップS22)。
When this operation is started, the DSS block header information of the DSS block to be subjected to voice recognition is read (step S21), and the recording mode (compression mode) of the DSS block is determined (step S22).

【0044】ここで、圧縮モードがSPモードであると
判断された場合には、そのDSSブロックについて音声
認識を実行し(ステップS23)、その音声認識の結果
を出力して例えば図7に示すように文字として上記ディ
スプレイ5に表示する(ステップS24)。
Here, when it is determined that the compression mode is the SP mode, speech recognition is executed for the DSS block (step S23), and the result of the speech recognition is output, for example, as shown in FIG. Are displayed on the display 5 as characters (step S24).

【0045】図7は、文章の表示を行うことができるソ
フトウェアの表示画面の一例を示した図であり、音声認
識の結果が表示されている状態を示している。この図7
において、画面41中の符号42や符号44に示した部
分が、その認識結果を表示する部分である。
FIG. 7 is a diagram showing an example of a display screen of software capable of displaying a sentence, and shows a state in which a result of voice recognition is displayed. This FIG.
In FIG. 7, the portions indicated by reference numerals 42 and 44 in the screen 41 are portions for displaying the recognition results.

【0046】そして、該DSSブロックについての音声
認識が終了したら、音声ファイルの終端に達したか否か
を判断し(ステップS26)、まだ終端でない場合に
は、上記ステップS21へ戻って、次のDSSブロック
についての処理を行う。
When the voice recognition for the DSS block is completed, it is determined whether or not the end of the voice file has been reached (step S26). If not, the process returns to step S21 to return to the next step S21. Perform processing for the DSS block.

【0047】また、上記ステップS22において、圧縮
モードがLPモードであると判断された場合には、その
DSSブロックについては音声認識を実行しないことに
なるために、その旨の警告信号を出力して、上記ディス
プレイ5に、図7中の符号43に示すように表示させる
(ステップS24)。
If it is determined in step S22 that the compression mode is the LP mode, a speech signal is output to the effect that the speech recognition is not executed for the DSS block. Is displayed on the display 5 as indicated by reference numeral 43 in FIG. 7 (step S24).

【0048】この図7における例では、音声認識が不可
能となるブロックが18秒の録音時間分だけ存在する旨
を文字として表示しているが、これに限るものではな
く、例えば「?」や「*」などの記号を挿入するように
しても良く、さらには、挿入する記号の数を認識が不可
能となる時間に比例させるようにしても良い。
In the example shown in FIG. 7, the fact that blocks for which speech recognition cannot be performed for the recording time of 18 seconds is displayed as characters, but the present invention is not limited to this. For example, "?" Symbols such as “*” may be inserted, and the number of symbols to be inserted may be made to be proportional to the time when recognition becomes impossible.

【0049】こうして、上記ステップS26において、
音声ファイルの終端に達したと判断されたところで、音
声認識の処理を終了する。
Thus, in step S26,
When it is determined that the end of the voice file has been reached, the voice recognition processing ends.

【0050】なお、上述では音声情報認識装置として、
制御プログラムや音声認識プログラムを実行するパーソ
ナルコンピュータを例に挙げたが、勿論これに限るもの
ではなく、その他の汎用のコンピュータであっても良い
し、あるいは専用の音声情報認識装置として構成しても
構わない。
In the above description, the speech information recognition device is
Although the personal computer that executes the control program and the voice recognition program has been described as an example, the present invention is not limited to this, and may be another general-purpose computer or may be configured as a dedicated voice information recognition device. I do not care.

【0051】このような実施形態によれば、圧縮率が音
声認識に適したものであるか否かをブロック単位(音声
ブロック単位)で確認しているために、一つの音声ファ
イル内に音声認識に適しているブロックと適していない
ブロックとが混在する場合でも、音声認識可能な部分に
ついては音声認識を行って文字情報に変換することがで
きる。
According to such an embodiment, since it is confirmed in block units (in audio block units) whether or not the compression ratio is suitable for speech recognition, audio recognition is performed in one audio file. Even if there are blocks that are suitable for and some blocks that are not suitable, it is possible to perform voice recognition on the part that can be recognized and convert it into character information.

【0052】また、音声認識が行われないときにはディ
スプレイにその旨を表示するために、容易に認識するこ
とが可能となる。そして、音声認識が行われない時間長
さに比例した表示を行えば、その量をより感覚的に把握
し易くなる。
Further, when the voice recognition is not performed, the fact is displayed on the display, so that the recognition can be easily performed. If the display is performed in proportion to the length of time during which the speech recognition is not performed, the amount can be more intuitively grasped.

【0053】なお、本発明は上述した実施形態に限定さ
れるものではなく、発明の主旨を逸脱しない範囲内にお
いて種々の変形や応用が可能であることは勿論である。
It should be noted that the present invention is not limited to the above-described embodiment, and it is needless to say that various modifications and applications can be made without departing from the gist of the invention.

【0054】[付記]以上詳述したような本発明の上記
実施形態によれば、以下のごとき構成を得ることができ
る。
[Appendix] According to the embodiment of the present invention described in detail above, the following configuration can be obtained.

【0055】(1) 音声ファイル内に所定のブロック
単位で格納されている音声情報を、該ブロック毎に音声
認識して文字情報に変換する音声認識手段と、音声情報
が音声認識に適しているか否かをブロック毎に確認し
て、音声認識に適していると判断された場合にのみ、上
記音声認識手段による動作を実行させる制御手段と、を
具備したことを特徴とする音声情報認識装置。
(1) Speech recognition means for recognizing speech information stored in a speech file in units of predetermined blocks and converting it into character information for each block, and whether the speech information is suitable for speech recognition And a control unit for executing the operation by the voice recognition unit only when it is determined that the voice recognition unit is suitable for voice recognition.

【0056】(2) 上記制御手段は、ブロック単位の
音声情報の圧縮率が、所定の圧縮率以下である場合に音
声認識に適していると判断し、所定の圧縮率よりも大き
い場合には音声認識に適していないと判断するものであ
ることを特徴とする付記(1)に記載の音声情報認識装
置。
(2) The control means determines that the speech information is suitable for speech recognition when the compression rate of the audio information in block units is equal to or less than a predetermined compression rate, and when the compression rate is larger than the predetermined compression rate. The speech information recognition device according to supplementary note (1), which determines that the speech information is not suitable for speech recognition.

【0057】(3) 上記制御手段により音声認識に適
していないと判断された場合には、その旨を警告する警
告手段をさらに具備したことを特徴とする付記(1)に
記載の音声情報認識装置。
(3) If the control means determines that the speech information is not suitable for speech recognition, a warning means for warning the fact is further provided. apparatus.

【0058】(4) 音声ファイル内に所定のブロック
単位で格納されている音声情報が、音声認識に適してい
るか否かをブロック毎に確認するステップと、音声認識
に適していると判断された場合にのみ、上記音声情報を
上記ブロック毎に音声認識して文字情報に変換するステ
ップと、を具備したことを特徴とする音声認識方法。
(4) A step of checking for each block whether or not the voice information stored in the voice file in a predetermined block unit is suitable for voice recognition, and it is determined that the voice information is suitable for voice recognition. And performing speech recognition of the speech information on a block-by-block basis and converting the speech information into character information only in the above case.

【0059】(5) コンピュータによって音声情報の
認識をするためのプログラムを記録した記録媒体であっ
て、該プログラムは、コンピュータに、音声ファイル内
に所定のブロック単位で格納されている音声情報が、音
声認識に適しているか否かをブロック毎に確認させ、音
声認識に適していると判断された場合にのみ、上記音声
情報を上記ブロック毎に音声認識して文字情報に変換さ
せるものであることを特徴とする音声情報の認識をする
ためのプログラムを記録した記録媒体。
(5) A recording medium in which a program for recognizing audio information by a computer is recorded. The program stores, in the computer, audio information stored in a sound file in a predetermined block unit. It is necessary to confirm whether or not it is suitable for speech recognition for each block, and to convert the speech information to text information by speech recognition for each block only when it is determined that the speech information is suitable for speech recognition. A recording medium on which a program for recognizing audio information is recorded.

【0060】(6) 音声情報を記録する記録媒体と、
この記録媒体に記録された音声情報を文字情報に変換す
る変換手段と、この変換手段による音声情報の処理を、
該音声情報の圧縮率に応じて制御する制御手段と、を具
備したことを特徴とする音声情報認識装置。
(6) a recording medium for recording audio information;
Converting means for converting the audio information recorded on the recording medium into character information, and processing the audio information by the converting means;
Control means for controlling the voice information in accordance with the compression ratio of the voice information.

【0061】(7) 警告手段をさらに具備し、上記制
御手段は、上記圧縮率が音声認識可能な範囲である場合
には上記変換手段に音声認識を行わせ文字情報を出力さ
せ、音声認識可能な範囲外である場合には上記警告手段
にその旨を警告させるものであることを特徴とする付記
(6)に記載の音声情報認識装置。
(7) A warning means is further provided, wherein the control means causes the conversion means to perform speech recognition when the compression ratio is within a range in which speech recognition is possible, and outputs character information to enable speech recognition. The voice information recognition apparatus according to (6), wherein when the value is out of the range, the warning means is warned to that effect.

【0062】従って、付記(1)に記載の発明によれ
ば、音声情報が音声認識に適しているか否かをブロック
単位で確認しているために、一つの音声ファイル内に音
声認識に適している音声情報ブロックと適していない音
声情報ブロックとが混在する場合でも、音声認識可能な
部分については音声認識を行って文字情報に変換するこ
とができる。
Therefore, according to the invention described in the appendix (1), whether or not the voice information is suitable for voice recognition is confirmed in units of blocks, so that one voice file is suitable for voice recognition. Even in the case where there are voice information blocks that are present and voice information blocks that are not suitable, it is possible to perform voice recognition on the part that can be recognized and convert it into character information.

【0063】また、付記(2)に記載の発明によれば、
付記(1)に記載の発明と同様の効果を奏するととも
に、音声認識に適しているか否かを圧縮率により判断す
ることができる。
According to the invention described in Appendix (2),
The present invention has the same effect as the invention described in Appendix (1), and can determine whether or not it is suitable for speech recognition based on the compression ratio.

【0064】さらに、付記(3)に記載の発明によれ
ば、付記(1)に記載の発明と同様の効果を奏するとと
もに、音声認識が行われないときには警告手段により警
告が行われるために、その旨を認識することが可能とな
る。
Further, according to the invention described in the supplementary note (3), the same effect as that of the invention described in the supplementary note (1) is obtained, and a warning is issued by the warning means when the voice recognition is not performed. It is possible to recognize that.

【0065】付記(4)に記載の発明によれば、音声情
報が音声認識に適しているか否かをブロック単位で確認
しているために、一つの音声ファイル内に音声認識に適
している音声情報ブロックと適していない音声情報ブロ
ックとが混在する場合でも、音声認識可能な部分につい
ては音声認識を行って文字情報に変換することができ
る。
According to the invention described in Appendix (4), whether or not the speech information is suitable for speech recognition is confirmed in block units, so that a speech file suitable for speech recognition is contained in one speech file. Even when the information block and the unsuitable voice information block are mixed, the voice recognizable portion can be converted into character information by performing voice recognition.

【0066】付記(5)に記載の発明によれば、該プロ
グラムによりコンピュータを制御することによって、音
声情報が音声認識に適しているか否かがブロック単位で
確認されるために、一つの音声ファイル内に音声認識に
適している音声情報ブロックと適していない音声情報ブ
ロックとが混在する場合でも、音声認識可能な部分につ
いては音声認識を行って文字情報に変換することができ
る。
According to the invention described in the supplementary note (5), by controlling the computer by the program, it is confirmed whether or not the speech information is suitable for speech recognition in units of blocks. Even if the voice information block suitable for voice recognition and the voice information block not suitable for voice recognition coexist, the voice recognizable portion can be converted to character information by performing voice recognition.

【0067】付記(6)に記載の発明によれば、音声情
報から文字情報への変換を、圧縮率に応じて制御してい
るために、一つの音声ファイル内に異なる圧縮率の音声
データが混在する場合でも、音声認識可能な部分につい
ては音声認識の対象とすることが可能となる。
According to the invention described in the appendix (6), since the conversion from the audio information to the character information is controlled in accordance with the compression ratio, audio data having different compression ratios can be stored in one audio file. Even in a mixed case, a portion that can be recognized by speech can be subjected to speech recognition.

【0068】付記(7)に記載の発明によれば、付記
(6)に記載の発明と同様の効果を奏するとともに、音
声認識が行われないときには警告手段により警告が行わ
れるために、その旨を認識することが可能となる。
According to the invention described in the supplementary note (7), the same effect as the invention described in the supplementary note (6) can be obtained, and a warning is issued by the warning means when the voice recognition is not performed. Can be recognized.

【0069】[0069]

【発明の効果】以上説明したように請求項1による本発
明の音声情報認識装置によれば、音声情報から文字情報
への変換を、圧縮率に応じて制御しているために、一つ
の音声ファイル内に異なる圧縮率の音声データが混在す
る場合でも、音声認識可能な部分については音声認識の
対象とすることが可能となる。
As described above, according to the speech information recognition apparatus of the present invention according to the first aspect, since the conversion from speech information to character information is controlled according to the compression ratio, one speech is recognized. Even when voice data with different compression ratios are mixed in a file, it is possible to perform a voice recognition on a part that can be recognized.

【0070】また、請求項2による本発明の音声情報認
識装置によれば、請求項1に記載の発明と同様の効果を
奏するとともに、音声認識が行われないときには所定の
警告信号を出力するようにしたために、その旨を認識す
ることが可能となる。
According to the second aspect of the present invention, the same effects as those of the first aspect can be obtained, and a predetermined warning signal is output when no voice recognition is performed. This makes it possible to recognize that fact.

【0071】さらに、請求項3による本発明の音声情報
認識装置によれば、請求項1または請求項2に記載の発
明と同様の効果を奏することができる。
Further, according to the voice information recognition apparatus of the present invention, the same effects as those of the first or second aspect can be obtained.

【0072】請求項4による本発明の音声情報認識方法
によれば、音声情報から文字情報への変換を、圧縮率に
応じて制御しているために、一つの音声ファイル内に異
なる圧縮率の音声データが混在する場合でも、音声認識
可能な部分については音声認識の対象とすることが可能
となる。
According to the voice information recognition method of the present invention, since the conversion from voice information to character information is controlled according to the compression ratio, different compression ratios in one voice file can be obtained. Even in the case where voice data is mixed, a portion that can be recognized by voice can be subjected to voice recognition.

【0073】請求項5による本発明の音声情報の認識を
するためのプログラムを記録した記録媒体によれば、該
プログラムによりコンピュータを制御することによっ
て、音声情報から文字情報への変換が、圧縮率に応じて
制御されるために、一つの音声ファイル内に異なる圧縮
率の音声データが混在する場合でも、音声認識可能な部
分については音声認識の対象とすることが可能となる。
According to the recording medium storing the program for recognizing speech information of the present invention according to claim 5, by controlling the computer with the program, the conversion from the speech information to the character information can be performed at the compression ratio. Therefore, even when voice data having different compression ratios are mixed in one voice file, a voice recognizable portion can be subjected to voice recognition.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態におけるディクテーション
システムの全体的な構成を示す図。
FIG. 1 is a diagram showing an overall configuration of a dictation system according to an embodiment of the present invention.

【図2】上記実施形態のディクテーションシステムにお
けるパーソナルコンピュータの電気的な構成を示すブロ
ック図。
FIG. 2 is an exemplary block diagram showing an electric configuration of a personal computer in the dictation system of the embodiment.

【図3】上記実施形態のディクテーションシステムにお
ける音声ファイルの構造を示すブロック図。
FIG. 3 is a block diagram showing a structure of an audio file in the dictation system of the embodiment.

【図4】上記実施形態のパーソナルコンピュータにおい
て、音声認識を行うときの動作を示すフローチャート。
FIG. 4 is a flowchart showing an operation when performing voice recognition in the personal computer of the embodiment.

【図5】上記図4における音声認識処理の詳細を示すフ
ローチャート。
FIG. 5 is a flowchart showing details of a voice recognition process in FIG. 4;

【図6】上記実施形態のパーソナルコンピュータにおい
て、音声認識を行うときの画面表示の一例を示す図。
FIG. 6 is an exemplary view showing an example of a screen display when performing voice recognition in the personal computer of the embodiment.

【図7】上記実施形態のパーソナルコンピュータにおい
て、音声認識の結果を示す表示画面の一例を示す図。
FIG. 7 is an exemplary view showing an example of a display screen showing a result of voice recognition in the personal computer of the embodiment.

【符号の説明】[Explanation of symbols]

1…ディジタルレコーダ 2…ミニチュアカード 4…パーソナルコンピュータ(音声情報認識装置) 5…ディスプレイ(警告手段) 6…キーボード 7…マウス 8…制御プログラム 9…音声認識プログラム 11…CPU(変換手段、制御手段、音声認識手段) 12…メインメモリ 13…内部記録媒体(音声情報の認識をするためのプロ
グラムを記録した記録媒体)
DESCRIPTION OF SYMBOLS 1 ... Digital recorder 2 ... Miniature card 4 ... Personal computer (voice information recognition device) 5 ... Display (warning means) 6 ... Keyboard 7 ... Mouse 8 ... Control program 9 ... Voice recognition program 11 ... CPU (conversion means, control means, Voice recognition means) 12 main memory 13 internal recording medium (recording medium storing a program for recognizing voice information)

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 音声情報を認識して文字情報に変換する
変換手段と、 所定の圧縮率で符号化された音声情報を該圧縮率に応じ
て文字情報に変換するかしないかを制御する制御手段
と、 を具備したことを特徴とする音声情報認識装置。
1. A conversion means for recognizing voice information and converting it into character information, and a control for controlling whether or not voice information encoded at a predetermined compression rate is converted into text information according to the compression rate. Means, and a voice information recognition device, characterized by comprising:
【請求項2】 上記制御手段は、音声情報の圧縮率が音
声認識に適したレベルにあるときは上記変換手段に音声
認識を行わせて音声情報を文字情報に変換させ、音声情
報の圧縮率が音声認識に適さないレベルにあるときは所
定の警告信号を出力するものであることを特徴とする請
求項1に記載の音声情報認識装置。
And a control unit that, when the compression ratio of the speech information is at a level suitable for speech recognition, causes the conversion unit to perform speech recognition to convert the speech information into character information. 2. The speech information recognition apparatus according to claim 1, wherein a predetermined warning signal is output when is at a level not suitable for speech recognition.
【請求項3】 音声ブロック毎に文字情報に変換するか
しないかの制御を行うことを特徴とする請求項1または
請求項2に記載の音声情報認識装置。
3. The voice information recognition device according to claim 1, wherein control is performed to determine whether or not to convert to character information for each voice block.
【請求項4】 所定の圧縮率で符号化された音声情報を
該圧縮率に応じて文字情報に変換するかしないかを制御
し、 文字情報に変換するという制御がされたときには音声情
報を認識して文字情報に変換させることを特徴とする音
声情報認識方法。
4. Controlling whether or not voice information encoded at a predetermined compression rate is converted into character information according to the compression rate, and recognizes voice information when control is performed to convert the information into character information. A voice information recognizing method characterized by converting the voice information into character information.
【請求項5】 コンピュータによって音声情報の認識を
するためのプログラムを記録した記録媒体であって、 該プログラムは、コンピュータに、 所定の圧縮率で符号化された音声情報を該圧縮率に応じ
て文字情報に変換するかしないかを制御させ、 文字情報に変換するという制御がされたときには、音声
情報を認識して文字情報に変換させることを特徴とする
音声情報の認識をするためのプログラムを記録した記録
媒体。
5. A recording medium on which a program for recognizing audio information by a computer is recorded, said program causing the computer to convert audio information encoded at a predetermined compression rate in accordance with the compression rate. A program for recognizing voice information characterized by recognizing voice information and converting it to text information is controlled when the control to convert or not to text information is performed. The recording medium on which it was recorded.
JP11063630A 1999-03-10 1999-03-10 Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded Withdrawn JP2000259181A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11063630A JP2000259181A (en) 1999-03-10 1999-03-10 Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11063630A JP2000259181A (en) 1999-03-10 1999-03-10 Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded

Publications (1)

Publication Number Publication Date
JP2000259181A true JP2000259181A (en) 2000-09-22

Family

ID=13234870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11063630A Withdrawn JP2000259181A (en) 1999-03-10 1999-03-10 Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded

Country Status (1)

Country Link
JP (1) JP2000259181A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011002494A (en) * 2009-06-16 2011-01-06 Nippon Telegr & Teleph Corp <Ntt> Speech recognition device and method thereof, program and recording medium
CN110992739A (en) * 2019-12-26 2020-04-10 上海乂学教育科技有限公司 Student on-line dictation system
JP7481863B2 (en) 2020-03-06 2024-05-13 日本放送協会 Speech recognition error correction support device, program, and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011002494A (en) * 2009-06-16 2011-01-06 Nippon Telegr & Teleph Corp <Ntt> Speech recognition device and method thereof, program and recording medium
CN110992739A (en) * 2019-12-26 2020-04-10 上海乂学教育科技有限公司 Student on-line dictation system
CN110992739B (en) * 2019-12-26 2021-06-01 上海松鼠课堂人工智能科技有限公司 Student on-line dictation system
JP7481863B2 (en) 2020-03-06 2024-05-13 日本放送協会 Speech recognition error correction support device, program, and method

Similar Documents

Publication Publication Date Title
EP0887788B1 (en) Voice recognition apparatus for converting voice data present on a recording medium into text data
JP5087210B2 (en) Talking E book
US6965954B2 (en) Data playing system, transmitting and receiving apparatus, and bus conversion unit
JP2000352975A (en) Interface device
JP2000259181A (en) Device and method for recognizing speech information, and recording medium where program for recognizing speech information is recorded
US7027978B2 (en) Voice recording and reproducing apparatus, information processing apparatus, and recording medium having recorded an information processing program
JP7310706B2 (en) AGENT CONTROL DEVICE, AGENT CONTROL METHOD, AND AGENT CONTROL PROGRAM
JP2008171517A (en) On-vehicle playback device
JP4149370B2 (en) Order processing apparatus, order processing method, order processing program, order processing program recording medium, and order processing system
JP2008090202A (en) Tuning device and computer program for tuning
JP2007179632A (en) In-vehicle reproduction system
JP2004301980A (en) Speech interaction device and proxy device for speech interaction, and programs for them
JPH11212590A (en) Voice processor, recording medium with voice recognition program recorded, and recording medium with processing program recorded
JP2006323857A (en) Voice recognition processor, and recording medium recorded with voice recognition processing program
JP2000075893A (en) Voice recognition device
JP4198040B2 (en) Data utilization apparatus and data utilization method
JPH11231867A (en) Musical sound display device
JP2007219219A (en) Electronic device for language learning and creation method of sentence list for learning
JP4389516B2 (en) Audio data output device
JP4517645B2 (en) Acoustic signal processing apparatus and program
JP2000181492A (en) Voice information processor and record medium where processing program for processing voice information is recorded
JP4159439B2 (en) Electronic musical instrument, musical sound generation method, and computer program
JP3905181B2 (en) Voice recognition processing device and recording medium recording voice recognition processing program
JP2000081899A (en) Speech recognizing device and speech recording and reproducing device
JP4290104B2 (en) Electronic musical instrument and waveform display program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060606