JP2005326677A - Voice memo printer - Google Patents

Voice memo printer Download PDF

Info

Publication number
JP2005326677A
JP2005326677A JP2004145400A JP2004145400A JP2005326677A JP 2005326677 A JP2005326677 A JP 2005326677A JP 2004145400 A JP2004145400 A JP 2004145400A JP 2004145400 A JP2004145400 A JP 2004145400A JP 2005326677 A JP2005326677 A JP 2005326677A
Authority
JP
Japan
Prior art keywords
voice
language
language pattern
pattern dictionary
printer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004145400A
Other languages
Japanese (ja)
Inventor
Yoshihiko Ikeda
喜彦 池田
Naoki Sekine
直樹 関根
Masanori Takeuchi
雅則 竹内
Junko Watanabe
順子 渡辺
Nobuo Watanabe
伸夫 渡辺
Shunji Saito
俊次 齊藤
Ekigen Yana
益源 梁
Wataru Sakurai
渉 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2004145400A priority Critical patent/JP2005326677A/en
Publication of JP2005326677A publication Critical patent/JP2005326677A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a voice memo printer with which users can leave memorandums freely, without being held by preparation times in all scenes, and which can be utilized efficiently. <P>SOLUTION: The voice memory printer extracts a word, having a language feature nearest to the feature of a voice inputted from a microphone 52, from a language pattern dictionary 60 in which language features of words which are to be used in special applications are registered and outputs it as a result of voice recognition and prints it. As a result, since language features of the words to be used in the special application are registered in the language pattern dictionary 60, a voice memory printer 1, with which incorrect recognition about voice recognition of voices uttered in the special application can be suppressed as much as possible, can be realized with a simple constitution. Thus, the voice memory printer 1, with which users can leave the memorandums freely without being caught by the preparing time in all scenes, and which can be utilized efficiently, can be provided. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、音声認識機能を搭載し、音声認識結果を印字可能な音声メモプリンタに関する。   The present invention relates to a voice memo printer equipped with a voice recognition function and capable of printing a voice recognition result.

マイクなどから入力された音声に基づいて生成された音声デジタルデータを解析し、人間の声をテキストに変換する音声認識技術はパーソナルコンピュータ等で活用され、キーボードによる手入力に代わる手段として普及し始めている。   Voice recognition technology that analyzes voice digital data generated based on voice input from a microphone, etc., and converts human voice into text has been utilized in personal computers, etc., and has begun to become popular as an alternative to manual input using a keyboard Yes.

一方、マイクなどから入力された音声を認識して用紙へ直接印字するものが知られている(例えば、特許文献1,2参照)。   On the other hand, there is known one that recognizes voice input from a microphone or the like and prints directly on a sheet (for example, see Patent Documents 1 and 2).

特開平5−35428号公報Japanese Patent Laid-Open No. 5-35428 特開平8−2015号公報JP-A-8-2015

ところで、近年、集団でアイデアを出すための会議方式の一つとして、ブレーンストーミング(Brain Stormimg Method)が一般的になっている。ブレーンストーミング(KJ法)は、最初の段階ではテーマについてのアイデアをアイデア単位で次々に付箋紙や小紙に書き込んでいき、アイデアが出尽くしたところでアイデアが書き出された各付箋紙等を分類し、テーマを分析するものである。   By the way, in recent years, brainstorming (Brain Stormimg Method) has become common as one of the conference methods for group ideas. In brainstorming (KJ method), the idea of the theme is written on sticky notes and small papers one after another in the initial stage, and each sticky note on which the idea is written is classified when the idea is exhausted. , Analyze themes.

しかしながら、発言をする度に付箋紙等に書き込んでいく従来のブレーンストーミングでは、付箋紙等に発言内容を書き込む等の手間により検討時間が減少し、能率が低下してしまう。   However, in conventional brainstorming in which writing is made on a sticky note each time a statement is made, the examination time is reduced due to the trouble of writing the contents of the statement on a sticky note or the like, and efficiency is lowered.

そこで、前述したような特許文献1,2のように音声認識技術を用いて人間の声を直接印字することも考えられるが、これは例えば会議の議事録を作成するために考えられたものであり、上述のようなブレーンストーミングに用いようとすると、印字したものを切ってから貼り付けるという作業という手間がかなりかかり、能率の低下は否めない。   Therefore, it is conceivable to directly print a human voice using the speech recognition technology as in Patent Documents 1 and 2 as described above, but this was conceived, for example, to create a meeting minutes. However, if it is intended to be used for brainstorming as described above, it takes a lot of labor to cut and paste the printed matter, and a reduction in efficiency cannot be denied.

また、従来の音声認識技術によれば、事前に長文を学習させ不特定に発せられた音声を誤認識なく認識させるために、高機能のパフォーマンスを有するCPUの環境下で装置を動作させなければならず、非常に高価なものとなっている。   Further, according to the conventional speech recognition technology, in order to learn long sentences in advance and recognize unspecified speech without misrecognition, the device must be operated under the environment of a CPU having high performance. It is very expensive.

本発明は、あらゆるシーンで作成時間にとらわれずに気軽にメモを残すことができ、能率的に活用できる音声メモプリンタを提供することを目的とする。   An object of the present invention is to provide a voice memo printer that can easily leave a memo regardless of the creation time in any scene and can be used efficiently.

本発明は、音声認識についての誤認識を極力抑えた音声メモプリンタを簡便な構成で実現することを目的とする。   SUMMARY OF THE INVENTION An object of the present invention is to realize a voice memo printer that suppresses erroneous recognition of voice recognition as much as possible with a simple configuration.

本発明は、音声を入力するマイクと、このマイクから入力された音声アナログデータを音声デジタルデータに変換するA/D変換手段と、このA/D変換手段により変換された音声デジタルデータを周波数変換して解析する周波数解析手段と、特定用途向けの言語パターン辞書を持つ音声認識手段と、前記周波数解析手段により解析された周波数に基づき前記音声認識手段から出力された音声認識結果を印字する印字手段と、を備える。   The present invention relates to a microphone for inputting voice, A / D conversion means for converting voice analog data inputted from the microphone into voice digital data, and frequency conversion of the voice digital data converted by the A / D conversion means. Frequency analysis means for analyzing the voice, speech recognition means having a language pattern dictionary for specific applications, and printing means for printing the speech recognition result output from the voice recognition means based on the frequency analyzed by the frequency analysis means And comprising.

したがって、マイクから入力された音声の音響特徴に最も近い言語特徴を有している単語が、言語パターン辞書から抽出されて音声認識結果として出力され、印字される。これにより、言語パターン辞書には特定用途で使われる単語の言語特徴が登録されていることから、特定用途で発せられる音声についての音声認識についての誤認識を極力抑えた音声メモプリンタを簡便な構成で実現することが可能になる。   Therefore, the word having the language feature closest to the acoustic feature of the voice input from the microphone is extracted from the language pattern dictionary, output as a voice recognition result, and printed. As a result, the language features of words used for specific purposes are registered in the language pattern dictionary, so a simple configuration of a voice memo printer that minimizes misrecognition of speech recognition for voices issued for specific purposes Can be realized.

本発明によれば、言語パターン辞書に特定用途で使われる言語特徴を登録していることから、特定用途で発せられる音声についての音声認識についての誤認識を極力抑えた音声メモプリンタを簡便な構成で実現することができるので、あらゆるシーンで作成時間にとらわれずに気軽にメモを残すことができ、能率的に活用できる音声メモプリンタを提供することができる。   According to the present invention, since a language feature used for a specific application is registered in the language pattern dictionary, a simple configuration of a voice memo printer that suppresses misrecognition of voice recognition for a voice emitted for a specific application as much as possible. Therefore, it is possible to provide a voice memo printer that can easily leave a memo in any scene regardless of the creation time and can be used efficiently.

本発明の実施の一形態を図1ないし図7に基づいて説明する。   An embodiment of the present invention will be described with reference to FIGS.

ここで、図1は本発明の実施の一形態の音声メモプリンタ1をラベル排出側から示す外観斜視図、図2は音声メモプリンタ1をオペレータ装着側から示す外観斜視図、図3は音声メモプリンタ1の内部構造を示す水平断面図である。   Here, FIG. 1 is an external perspective view showing the voice memo printer 1 according to an embodiment of the present invention from the label discharge side, FIG. 2 is an external perspective view showing the voice memo printer 1 from the operator mounting side, and FIG. FIG. 2 is a horizontal sectional view showing the internal structure of the printer 1.

図1ないし図3に示すように、携帯可能なポータブルプリンタである音声メモプリンタ1のプリンタ本体1aは、一面が開放されたケース2と、このケース2の開放された面を開閉するカバー3とより構成されている。カバー3は、ケース2に設けられた支点軸4により回動自在に支持されている。そして、ケース2には、カバー3を閉じた状態で、ロール状に巻回された長尺状の記録紙5を転動自在に収納するホッパ6が形成されている。なお、本実施の形態においては、記録紙5として台紙5aに多数のラベル5bを等間隔で貼付したものを用いているが、他の記録紙を用いても良い。ラベル5bには粘着力の弱い糊が塗布されており、印字発行後には、付箋紙P(図7参照)としても利用可能である。   As shown in FIGS. 1 to 3, a printer main body 1a of a voice memo printer 1 which is a portable portable printer includes a case 2 with one side opened, and a cover 3 for opening and closing the opened side of the case 2. It is made up of. The cover 3 is rotatably supported by a fulcrum shaft 4 provided on the case 2. The case 2 is formed with a hopper 6 for storing the long recording paper 5 wound in a roll shape with the cover 3 closed. In the present embodiment, the recording paper 5 is obtained by attaching a large number of labels 5b to the mount 5a at equal intervals, but other recording paper may be used. The label 5b is coated with adhesive having a weak adhesive force, and can be used as a sticky note P (see FIG. 7) after the printing is issued.

このようなケース2には、ホッパ6の底部からカバー3側に向けて延出する用紙ガイド7が設けられており、この用紙ガイド7のカバー3に近い部分には、回転自在のプラテン8と、このプラテン8の長手方向に沿うラベル剥離体9とが配設されている。   In such a case 2, a paper guide 7 extending from the bottom of the hopper 6 toward the cover 3 is provided. A portion of the paper guide 7 near the cover 3 has a rotatable platen 8 and A label peeling body 9 along the longitudinal direction of the platen 8 is disposed.

図3に示すように、カバー3の内面(ホッパ6側)には、サーマルヘッド12を備えたヘッド支持体11が支軸11aを中心に回動自在に設けられている。このヘッド支持体11は板ばね13により一方向に付勢されており、サーマルヘッド12はカバー3を閉じた状態でプラテン8に当接することになる。すなわち、プラテン8とサーマルヘッド12とにより印字部14が形成されている。   As shown in FIG. 3, a head support 11 having a thermal head 12 is provided on the inner surface of the cover 3 (on the hopper 6 side) so as to be rotatable around a support shaft 11a. The head support 11 is biased in one direction by a leaf spring 13, and the thermal head 12 comes into contact with the platen 8 with the cover 3 closed. That is, the printing unit 14 is formed by the platen 8 and the thermal head 12.

また、カバー3の自由端側の両側には、スプリング15の付勢力によりプラテン8に圧接されたピンチローラ16が回転自在に設けられている。さらに、カバー3には、サーマルヘッド12とピンチローラ16との間に配置されてラベル5bを排出させるラベル排出口17と、ホッパ6内の記録紙5の浮きを押える紙押え18とが形成されている。ケース2にはカバー3の自由端との間で台紙5aを排出させる台紙排出口19が形成されている。   Further, on both sides of the free end side of the cover 3, pinch rollers 16 that are pressed against the platen 8 by the urging force of the spring 15 are rotatably provided. Further, the cover 3 is formed with a label discharge port 17 that is disposed between the thermal head 12 and the pinch roller 16 and discharges the label 5b, and a paper presser 18 that presses the floating of the recording paper 5 in the hopper 6. ing. The case 2 is formed with a mount discharge port 19 for discharging the mount 5 a between the free end of the cover 3.

ケース2の上面には、バッテリ10(図3参照)からの電力供給のON/OFFを宣言する電源スイッチ20、ラベル5bに印字を行わせるフィードスイッチ21、蓋部22、赤外線を受光する受光窓23が設けられている。蓋部22は、ケース2の一つの面である上面に開口して設けられたバッテリ収納部30(図3参照)に対してバッテリ10を着脱する場合に開閉するものである。さらに、カバー3の両側には係止爪24がスライド自在に設けられている(図1参照)。これらの係止爪24は外側に向けて付勢されてケース2に係止され、カバー3を開放するときに係止爪24を矢印マークで示すように内方スライドさせてケース2との係止状態を解除する。   On the upper surface of the case 2, a power switch 20 that declares ON / OFF of power supply from the battery 10 (see FIG. 3), a feed switch 21 that performs printing on the label 5 b, a lid 22, and a light receiving window that receives infrared rays. 23 is provided. The lid portion 22 opens and closes when the battery 10 is attached to and detached from the battery storage portion 30 (see FIG. 3) provided to be opened on the upper surface that is one surface of the case 2. Further, locking claws 24 are slidably provided on both sides of the cover 3 (see FIG. 1). These locking claws 24 are urged outward to be locked to the case 2, and when the cover 3 is opened, the locking claws 24 are slid inward as indicated by the arrow marks to engage with the case 2. Release the stop state.

また、ケース2のラベル排出口17と同一面には、内蔵マイク52が設けられている。本実施の形態の音声メモプリンタ1には、音声認識機能が搭載されており、この内蔵マイク52は、この音声認識機能を実行する際に用いられるものである。   A built-in microphone 52 is provided on the same surface of the case 2 as the label discharge port 17. The voice memo printer 1 according to the present embodiment is equipped with a voice recognition function, and the built-in microphone 52 is used when executing the voice recognition function.

加えて、ケース2の上面には、LED56が配設されている。本実施の形態の音声メモプリンタ1は、このLED56を点灯させたり点滅させることにより、音声メモプリンタ1の動作状態をオペレータに対して報知することができるようになっている。   In addition, an LED 56 is disposed on the upper surface of the case 2. The voice memo printer 1 of the present embodiment can notify the operator of the operation state of the voice memo printer 1 by turning on or blinking the LED 56.

さらに、図2に示すように、プリンタ本体1aのカバー3とは反対側の一面には、オペレータの腰のあたりに密着される弧面25が形成され、この弧面25にはオペレータの衣服に対して滑りを少なくするための滑り止め26と、この滑り止め26に対向してオペレータのベルトに引っ掛けられるベルト掛け27とが形成されている。   Further, as shown in FIG. 2, an arc surface 25 is formed on one surface of the printer body 1a opposite to the cover 3 so as to be in close contact with the operator's waist. On the other hand, a non-slip 26 for reducing slippage and a belt hook 27 which is hooked on the operator's belt so as to face the non-slip 26 are formed.

このような構成により、バッテリ10がバッテリ収納部30へと正しく収納された場合には、電源スイッチ20がONしている状態でバッテリ収納部30の端子とバッテリ10の端子とが接触して電気的に接続された状態となり、バッテリ10から電力供給を必要とするサーマルヘッド12等の各部へと電力が供給されることになる。   With such a configuration, when the battery 10 is correctly stored in the battery storage unit 30, the terminal of the battery storage unit 30 and the terminal of the battery 10 come into contact with each other while the power switch 20 is ON. Thus, power is supplied from the battery 10 to each part such as the thermal head 12 that requires power supply.

このような音声メモプリンタ1は、記録紙5をセットする場合にカバー3を開放し、ロール状に巻回された記録紙5をプリンタ本体1aのホッパ6に収納し、カバー3が開放されている状態で記録紙5の先端をプラテン8及びラベル剥離体9を覆う位置まで引き出し、カバー3を閉塞する。これにより、図3に示すように、記録紙5の台紙5aの先端部分が、サーマルヘッド12とピンチローラ16とによりプラテン8上に圧接され、また、ラベル剥離体9により台紙5aの引き出し経路が鋭角に折曲され、ホッパ6の底面からの記録紙5の浮きが紙押え18により阻止される。記録紙5をセットしたプリンタ本体1aは、机上に置いて使用することも可能であるが、通常はオペレータの腰に装着した状態でも使用可能である。   In such a voice memo printer 1, when the recording paper 5 is set, the cover 3 is opened, the recording paper 5 wound in a roll shape is stored in the hopper 6 of the printer main body 1a, and the cover 3 is opened. In this state, the front end of the recording paper 5 is pulled out to a position covering the platen 8 and the label peeling body 9 and the cover 3 is closed. As a result, as shown in FIG. 3, the leading end portion of the mount 5a of the recording paper 5 is pressed against the platen 8 by the thermal head 12 and the pinch roller 16, and the pull-out path of the mount 5a is formed by the label peeling member 9. The recording paper 5 is bent at an acute angle and the recording paper 5 is prevented from floating from the bottom surface of the hopper 6. The printer main body 1a on which the recording paper 5 is set can be used by placing it on a desk, but it can also be used even when it is usually worn on the operator's waist.

次に、音声メモプリンタ1の各部の制御系の接続について図4を参照しつつ説明する。音声メモプリンタ1は、各部を集中的に制御するCPU(Central Processing Unit)41を備えており、このCPU41には、CPU41が実行するプログラム等の固定データが書き込まれているROM(Read Only Memory)42と、ワークデータ等の可変データを更新自在に書き込むRAM(Random Access Memory)43と、各種情報を登録するフラッシュメモリ44とがバスライン45を介して接続されている。そして、サーマルヘッド12を駆動するサーマルヘッドドライバ46、プラテン8が連結されたモータ47を駆動するモータドライバ48、各種センサ49が接続されたセンサ回路50、カバー3の開閉によりオン、オフするカバーオープンスイッチ51と電源スイッチ20とフィードスイッチ21とが接続されたスイッチ回路54、赤外線インタフェース55、LED56が接続された点灯制御回路57が、CPU41に接続されている。このように、図4に示す回路はプリンタ本体1aの内部に設けられた基板(図示せず)上に形成されている。なお、赤外線インタフェース55は、前述した受光窓23の内方に配置されている。インタフェースは図ではI/Fと記す。   Next, the connection of the control system of each part of the voice memo printer 1 will be described with reference to FIG. The voice memo printer 1 includes a CPU (Central Processing Unit) 41 that centrally controls each unit. The CPU 41 stores a ROM (Read Only Memory) in which fixed data such as a program executed by the CPU 41 is written. 42, a RAM (Random Access Memory) 43 in which variable data such as work data is renewably written, and a flash memory 44 for registering various information are connected via a bus line 45. Then, a thermal head driver 46 for driving the thermal head 12, a motor driver 48 for driving a motor 47 connected to the platen 8, a sensor circuit 50 to which various sensors 49 are connected, and a cover open that is turned on and off by opening and closing the cover 3. A switch circuit 54 to which the switch 51, the power switch 20 and the feed switch 21 are connected, an infrared interface 55, and a lighting control circuit 57 to which the LED 56 is connected are connected to the CPU 41. As described above, the circuit shown in FIG. 4 is formed on a substrate (not shown) provided inside the printer main body 1a. The infrared interface 55 is disposed inside the light receiving window 23 described above. The interface is denoted as I / F in the figure.

また、CPU41には、音声入力用CODEC53が接続されている。この音声入力用CODEC53には、内蔵マイク52が接続されている。音声入力用CODEC53は、A/D変換手段として機能するもので、内蔵マイク52から入力された音声アナログデータを音声デジタルデータに変換してCPU41に出力する。   The CPU 41 is connected with a voice input CODEC 53. A built-in microphone 52 is connected to the audio input CODEC 53. The audio input CODEC 53 functions as an A / D conversion unit, converts audio analog data input from the built-in microphone 52 into audio digital data, and outputs the audio digital data to the CPU 41.

さらに、CPU41には、音声認識エンジン58が接続されている。この音声認識エンジン58は、内蔵マイク52から入力されて音声入力用CODEC53で生成された音声デジタルデータを解析し、人間の声をテキストに変換するものである。このような音声認識エンジン58は、例えば、人間の発声の小さな単位(音素)の音響特徴(音韻)が登録される音響辞書59や音声認識させる単語の言語特徴が登録されている言語パターン辞書60を用いて音声認識を行う。   Further, a speech recognition engine 58 is connected to the CPU 41. The voice recognition engine 58 analyzes voice digital data input from the built-in microphone 52 and generated by the voice input CODEC 53, and converts human voice into text. Such a speech recognition engine 58 includes, for example, an acoustic dictionary 59 in which acoustic features (phonemes) of small units (phonemes) of human speech are registered, and a language pattern dictionary 60 in which language features of words to be recognized are registered. Voice recognition is performed using.

本実施の形態の言語パターン辞書60に登録されている音声認識させる単語は、特定用途に絞られている。特定用途では決まった言葉が発せられることが多いため、このように特定用途に絞った単語のみを言語パターン辞書60に登録するようにすることで、言語パターン辞書60を安価に構成することができる。具体的には、使用される用途において使用されるであろう会話や発声言語を一覧に纏め、用途別使用言語表(図示せず)とする。この用途別使用言語表に登録された各言語毎に、その言語の周波数を解析し、音声特徴(音韻情報)と言語特徴(音韻の系列情報)に分離する。このようにして分離された言語特徴が、言語パターン辞書60に登録される。   The words to be recognized by speech registered in the language pattern dictionary 60 of the present embodiment are limited to specific applications. Since a specific word is often issued in a specific application, the language pattern dictionary 60 can be configured at low cost by registering only the words focused on the specific application in the language pattern dictionary 60 in this way. . Specifically, a list of conversations and utterance languages that will be used in the application to be used is collected and used as a use language table (not shown) for each application. For each language registered in this use language table for each application, the frequency of the language is analyzed and separated into speech features (phoneme information) and language features (phoneme series information). The language features separated in this way are registered in the language pattern dictionary 60.

音響辞書59は、用途別でなく、音声認識全般に係わる辞書として使用される。声を発する原理は、
(1)『喉が震える』
(2)『口腔/鼻腔を通過』
と考えられることから、音響辞書59には、声の周波数から(1)(2)の形状を特定する情報(人間の発声の小さな単位(音素)の音響特徴(音韻))を格納する。
The acoustic dictionary 59 is used as a dictionary related to voice recognition in general, not by use. The principle of speaking is
(1) “My throat trembles”
(2) “Passing through oral cavity / nasal cavity”
Therefore, the sound dictionary 59 stores information (acoustic features (phonemes) of small units (phonemes) of human utterance) that specify the shapes of (1) and (2) from the frequency of the voice.

このような構成の音声認識エンジン58は、図5に示すように、内蔵マイク52から入力されて音声入力用CODEC53で生成された音声デジタルデータを周波数解析手段である周波数解析部58aにより周波数変換して解析し、比較部58bにおいて音響辞書59に基づいて音響特徴を抽出する(音声特徴抽出手段)。この段階では、前述した(1)(2)の形状が特定できただけで、50音のどれかは、未だ特定できない。そこで、言語パターン辞書60に登録されている単語の中から、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識結果として出力する(言語特徴抽出手段)。このように言語パターン辞書60と比較することで、初めて「あいうえお」等を特定することができる。不特定多数の言葉が発せられると特定は困難だが、特定の用途で発せられる言葉に絞り込むようにし、前述した(1)(2)の関係と音韻系列波形の特徴を単語全体で比較すれば、誤認識の可能性を極力抑える事ができ、このような簡便な機構で音声認識が可能となる。   As shown in FIG. 5, the speech recognition engine 58 having such a configuration performs frequency conversion on speech digital data input from the built-in microphone 52 and generated by the speech input CODEC 53 by a frequency analysis unit 58a which is a frequency analysis means. The comparison unit 58b extracts acoustic features based on the acoustic dictionary 59 (speech feature extraction means). At this stage, only the shapes (1) and (2) described above can be specified, and any of the 50 sounds cannot be specified yet. Therefore, from the words registered in the language pattern dictionary 60, a word whose language feature is closest to the acoustic feature of the input speech is searched for and output as a speech recognition result (language feature extraction means). By comparing with the language pattern dictionary 60 in this way, “Aiueo” or the like can be specified for the first time. It is difficult to specify when a large number of unspecified words are uttered, but if you try to narrow down to words that are uttered for a specific purpose and compare the relationship of (1) and (2) above and the characteristics of the phoneme sequence waveform, The possibility of misrecognition can be suppressed as much as possible, and speech recognition is possible with such a simple mechanism.

また、言語パターン辞書60は、音声メモプリンタ1に図示しない外部機器(パーソナルコンピュータ等)を赤外線インタフェース55を介して接続することで、当該外部機器から更新可能である。さらに、言語パターン辞書60を格納する言語パターン格納チップ(辞書)の交換や言語パターン辞書60の図示しない外部機器(パーソナルコンピュータ等)からのダウンロードによる登録内容の書き換えにより、言語パターン辞書60の内容を特定用途毎に変えることも可能である。新たな言語パターン辞書60が赤外線インタフェース55を介してダウンロードされた場合には、旧言語パターン辞書60は、抹消される。   The language pattern dictionary 60 can be updated from an external device by connecting an external device (such as a personal computer) (not shown) to the voice memo printer 1 via the infrared interface 55. Further, the contents of the language pattern dictionary 60 are changed by exchanging the language pattern storage chip (dictionary) for storing the language pattern dictionary 60 or rewriting the registered contents by downloading the language pattern dictionary 60 from an external device (such as a personal computer) (not shown). It is also possible to change for each specific application. When a new language pattern dictionary 60 is downloaded via the infrared interface 55, the old language pattern dictionary 60 is deleted.

次に、音声メモプリンタ1に内蔵されたROM42に格納された制御プログラムがCPU41に実行させる機能のうち、本実施の形態の音声メモプリンタ1が備える特長的な機能について説明する。   Next, of the functions that the control program stored in the ROM 42 built in the voice memo printer 1 causes the CPU 41 to execute, the characteristic functions provided in the voice memo printer 1 of the present embodiment will be described.

ここで、音声メモプリンタ1のCPU41が実行する音声印字処理について説明する。図6は、音声印字処理の流れを示すフローチャートである。図6に示すように、デジタル化された音声が入力されると(ステップS1のY)、ステップS2に進み、認識パターンの登録処理か、発声の音声認識処理かが判断される。   Here, the voice printing process executed by the CPU 41 of the voice memo printer 1 will be described. FIG. 6 is a flowchart showing the flow of the voice printing process. As shown in FIG. 6, when a digitized voice is input (Y in step S1), the process proceeds to step S2, and it is determined whether a recognition pattern registration process or an utterance voice recognition process.

発声の音声認識処理であると判断されると、音声認識エンジン58による音声認識処理が実行される(ステップS3)。   If it is determined that the speech recognition processing is utterance, the speech recognition processing by the speech recognition engine 58 is executed (step S3).

音声認識処理において言語パターン辞書60に登録されている単語であると判断された場合(ステップS4のY)、単語の言語特徴が入力音声の音響特徴に最も近い単語を探して音声認識結果として印字部14に出力して印字する(ステップS5:印字手段)。ここで、図7は発行された付箋紙Pの一例を示す平面図である。図7に示すように、付箋紙Pには、「○○○○というアイデア」と発声した場合のテキスト「○○○○というアイデア」が印字されている。   If it is determined in the speech recognition process that the word is registered in the language pattern dictionary 60 (Y in step S4), the word whose language feature is closest to the acoustic feature of the input speech is searched and printed as a speech recognition result. The data is output to the section 14 and printed (step S5: printing means). Here, FIG. 7 is a plan view showing an example of the issued sticky note P. FIG. As shown in FIG. 7, the sticky note P is printed with the text “idea of XXX” when “speaking of an idea of XXX”.

音声認識処理において言語パターン辞書60に登録されている単語でないと判断された場合(ステップS4のN)、音声認識せずにステップS1に戻る。   If it is determined in the voice recognition process that the word is not registered in the language pattern dictionary 60 (N in step S4), the process returns to step S1 without performing voice recognition.

一方、認識パターンの登録処理であると判断されると、ステップS6に進み、認識パターン登録処理を実行する。認識パターン登録処理は、使用される用途において使用されるであろう会話や発声言語を一覧に纏め、用途別使用言語表(図示せず)とし、この用途別使用言語表に登録された各言語毎に、その言語の周波数を解析し、音声特徴(音韻情報)と言語特徴(音韻の系列情報)に分離する。そして、このようにして分離された言語特徴を、言語パターン辞書60に登録する。   On the other hand, if it is determined that the process is a recognition pattern registration process, the process advances to step S6 to execute a recognition pattern registration process. In the recognition pattern registration process, conversations and utterance languages that will be used in the intended use are summarized in a list, and a use language table (not shown) for each use is registered, and each language registered in this use language table for each use Each time, the frequency of the language is analyzed and separated into speech features (phoneme information) and language features (phoneme sequence information). Then, the language features separated in this way are registered in the language pattern dictionary 60.

このような音声メモプリンタ1は、あらゆるシーンで利用可能である。例えば、ブレーンストーミングにおけるアイデア出しの際にはアイデアを発声するだけで付箋紙Pに発声したアイデアが印字された状態で発行されてくるので、発行された付箋紙Pを模造紙等に貼り付けていけばよい。また、弁当店等における注文を受ける際にも、注文を受けた商品について発声するだけで付箋紙Pに注文された商品が印字された状態で発行されてくるので、発行された付箋紙Pを注文票として利用することができる。この注文票は、商品引渡しの際に商品に貼り付けておくようにすれば、商品の取り違いを防止することもできる。   Such a voice memo printer 1 can be used in any scene. For example, in brainstorming, when an idea is put out, it is issued in a state where the idea uttered is printed on the sticky note P just by uttering the idea. I'll do it. Also, when an order is received at a bento store or the like, the ordered product is issued on the sticky note P simply by speaking about the ordered product. It can be used as an order form. If the order slip is affixed to the product when the product is delivered, it is possible to prevent the product from being mixed.

このように本実施の形態によれば、内蔵マイク52から入力された音声の特徴に最も近い言語特徴を有している単語が、言語パターン辞書60から抽出されて音声認識結果として出力され、印字される。これにより、言語パターン辞書60には特定用途で使われる単語の言語特徴が登録されていることから、特定用途で発せられる音声についての音声認識についての誤認識を極力抑えた音声メモプリンタ1を簡便な構成で実現することができるので、あらゆるシーンで作成時間にとらわれずに気軽にメモを残すことができ、能率的に活用できる音声メモプリンタ1を提供することができる。   As described above, according to the present embodiment, the word having the language feature closest to the feature of the voice input from the built-in microphone 52 is extracted from the language pattern dictionary 60 and output as the voice recognition result for printing. Is done. As a result, the language features of the words used in the specific application are registered in the language pattern dictionary 60. Therefore, the voice memo printer 1 that suppresses the misrecognition of the voice recognition of the voice generated in the specific application as much as possible can be simplified. Since it can be realized with a simple configuration, it is possible to provide a voice memo printer 1 that can easily leave a memo regardless of the creation time in any scene and can be used efficiently.

なお、本実施の形態においては、音声認識させる特定用途についての単語の言語特徴を登録している単一の言語パターン辞書60を備えるようにしたが、これに限るものではなく、異なる特定用途についての単語の言語特徴をそれぞれ登録している複数の言語パターン辞書60を備えるようにしても良い。この場合、特定用途別に言語パターン辞書60を切り替えて使用するようにすれば良い。言語パターン辞書60を切り替えは、入力された音声内容により切り替えるようにしても良いし、スイッチによって切り替えるようにしても良い。   In the present embodiment, the single language pattern dictionary 60 that registers the linguistic features of words for specific applications to be recognized by speech is provided. However, the present invention is not limited to this. A plurality of language pattern dictionaries 60 each registering the language characteristics of the word may be provided. In this case, the language pattern dictionary 60 may be switched and used for each specific application. The language pattern dictionary 60 may be switched according to the input voice content or may be switched by a switch.

本発明の実施の一形態の音声メモプリンタをラベル排出側から示す外観斜視図である。1 is an external perspective view showing a voice memo printer according to an embodiment of the present invention from a label discharge side. 音声メモプリンタをオペレータ装着側から示す外観斜視図である。It is an external appearance perspective view which shows a voice memo printer from the operator mounting side. 音声メモプリンタの内部構造を示す水平断面図である。It is a horizontal sectional view showing the internal structure of the voice memo printer. 音声メモプリンタの各部の制御系の接続を示すブロック図である。It is a block diagram which shows the connection of the control system of each part of a voice memo printer. 音声認識エンジンの構成を示すブロック図である。It is a block diagram which shows the structure of a speech recognition engine. 音声印字処理の流れを示すフローチャートである。It is a flowchart which shows the flow of an audio | voice printing process. 発行された付箋紙の一例を示す平面図である。It is a top view which shows an example of the issued sticky note paper.

符号の説明Explanation of symbols

1…音声メモプリンタ、52…マイク、53…A/D変換手段、58a…周波数解析手段、59…音響辞書、60…言語パターン辞書
DESCRIPTION OF SYMBOLS 1 ... Voice memo printer, 52 ... Microphone, 53 ... A / D conversion means, 58a ... Frequency analysis means, 59 ... Acoustic dictionary, 60 ... Language pattern dictionary

Claims (5)

音声を入力するマイクと、
このマイクから入力された音声アナログデータを音声デジタルデータに変換するA/D変換手段と、
このA/D変換手段により変換された音声デジタルデータを周波数変換して解析する周波数解析手段と、
特定用途向けの言語パターン辞書を持つ音声認識手段と、
前記周波数解析手段により解析された周波数に基づき前記音声認識手段から出力された音声認識結果を印字する印字手段と、
を備える音声メモプリンタ。
A microphone for voice input,
A / D conversion means for converting audio analog data input from the microphone into audio digital data;
Frequency analysis means for frequency-converting and analyzing the audio digital data converted by the A / D conversion means;
A voice recognition means having a language pattern dictionary for specific applications;
Printing means for printing a voice recognition result output from the voice recognition means based on the frequency analyzed by the frequency analysis means;
Voice memo printer equipped with.
音声を入力するマイクと、
このマイクから入力された音声アナログデータを音声デジタルデータに変換するA/D変換手段と、
このA/D変換手段により変換された音声デジタルデータを周波数変換して解析する周波数解析手段と、
特定用途についての言語特徴を有する言語パターン辞書と、
前記周波数解析手段により解析した周波数に基づいて前記言語パターン辞書の一つを選択する言語特徴抽出手段と、
この言語特徴抽出手段により出力された音声認識結果を印字する印字手段と、
を備える音声メモプリンタ。
A microphone for voice input,
A / D conversion means for converting audio analog data input from the microphone into audio digital data;
Frequency analysis means for frequency-converting and analyzing the audio digital data converted by the A / D conversion means;
A language pattern dictionary with linguistic features for specific uses;
Language feature extraction means for selecting one of the language pattern dictionaries based on the frequency analyzed by the frequency analysis means;
Printing means for printing the speech recognition result output by the language feature extraction means;
Voice memo printer equipped with.
前記言語パターン辞書は特定用途毎に用意されており、特定用途に応じて交換可能である、
請求項1記載の音声メモプリンタ。
The language pattern dictionary is prepared for each specific application and can be exchanged according to the specific application.
The voice memo printer according to claim 1.
前記言語パターン辞書は特定用途毎に複数用意されており、特定用途に応じて前記言語パターン辞書を切り替える、
請求項1記載の音声メモプリンタ。
A plurality of language pattern dictionaries are prepared for each specific application, and the language pattern dictionary is switched according to the specific application.
The voice memo printer according to claim 1.
前記言語パターン辞書の登録内容は、外部機器から書き換え可能である、
請求項1ないし4のいずれか一記載の音声メモプリンタ。

The registered contents of the language pattern dictionary can be rewritten from an external device.
The voice memo printer according to any one of claims 1 to 4.

JP2004145400A 2004-05-14 2004-05-14 Voice memo printer Pending JP2005326677A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004145400A JP2005326677A (en) 2004-05-14 2004-05-14 Voice memo printer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004145400A JP2005326677A (en) 2004-05-14 2004-05-14 Voice memo printer

Publications (1)

Publication Number Publication Date
JP2005326677A true JP2005326677A (en) 2005-11-24

Family

ID=35473070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004145400A Pending JP2005326677A (en) 2004-05-14 2004-05-14 Voice memo printer

Country Status (1)

Country Link
JP (1) JP2005326677A (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0490600A (en) * 1990-08-03 1992-03-24 Sony Corp Voice recognition device
JPH0850498A (en) * 1994-05-10 1996-02-20 Telia Ab Method and apparatus for comversion of voice into text
JP2003004470A (en) * 2001-06-18 2003-01-08 Alpine Electronics Inc Voice recognition unit for navigation
JP2003280683A (en) * 2002-03-20 2003-10-02 Toshiba Corp Voice recognition device, voice recognition control method of the device, and dictionary controller related to voice processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0490600A (en) * 1990-08-03 1992-03-24 Sony Corp Voice recognition device
JPH0850498A (en) * 1994-05-10 1996-02-20 Telia Ab Method and apparatus for comversion of voice into text
JP2003004470A (en) * 2001-06-18 2003-01-08 Alpine Electronics Inc Voice recognition unit for navigation
JP2003280683A (en) * 2002-03-20 2003-10-02 Toshiba Corp Voice recognition device, voice recognition control method of the device, and dictionary controller related to voice processing

Similar Documents

Publication Publication Date Title
Cutler et al. The predominance of strong initial syllables in the English vocabulary
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
Kim et al. The use of prosody in a combined system for punctuation generation and speech recognition.
AU3589400A (en) Distributed voice recognition system
WO2000045290A1 (en) A method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
WO2007051106A3 (en) Semantic processor for recognition of cause-effect relations in natural language documents
WO2000045376A1 (en) A method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
ATE254327T1 (en) VOICE RECOGNITION APPARATUS USING A COMMAND LEXICO
Lileikytė et al. Conversational telephone speech recognition for Lithuanian
EP1504442A1 (en) Voice command and voice recognition for hand-held devices
KR20190032557A (en) Voice-based communication
JP4544933B2 (en) Voice memo printer
JP2005326677A (en) Voice memo printer
Mohanty Phonotactic model for spoken language identification in Indian language perspective
JP4584615B2 (en) Voice recognition result printing device
JP2005309065A (en) Speech recognition result output device
Pandey Phonology–orthography interface in Devanāgarī for Hindi
JP2004170466A (en) Voice recognition method and electronic device
JPH082015A (en) Printer equipment
JPS58195900A (en) Voice input type japanese language document processor
Pisarn et al. Thai spelling recognition using a continuous speech corpus
TW201118856A (en) The LR-Book handheld device based on ARM920T embedded platform
Books Type of publication: Idiap-RR Citation: bourlard04 Number: Idiap-RR-58-2004 Year: 2004 Institution: IDIAP
Van Bael Automatic phonetic transcription of large speech corpora: A comparative study

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091113

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091030

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100129

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100323