JPH10133847A - Mobile terminal system for voice recognition, database search, and resource access communications - Google Patents

Mobile terminal system for voice recognition, database search, and resource access communications

Info

Publication number
JPH10133847A
JPH10133847A JP8285086A JP28508696A JPH10133847A JP H10133847 A JPH10133847 A JP H10133847A JP 8285086 A JP8285086 A JP 8285086A JP 28508696 A JP28508696 A JP 28508696A JP H10133847 A JPH10133847 A JP H10133847A
Authority
JP
Japan
Prior art keywords
mobile terminal
voice
search
data
host device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8285086A
Other languages
Japanese (ja)
Inventor
Toru Yamakita
徹 山北
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP8285086A priority Critical patent/JPH10133847A/en
Publication of JPH10133847A publication Critical patent/JPH10133847A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To realize voice recognition, database search, and resource access function as a user interface with practical accuracy and cost in communications environment using a mobile terminal. SOLUTION: In the mobile terminal 101, a voice signal inputted from an input part 109 is transmitted to a PHS network 103 from a control part 110 and a communication part 111, and transmitted to a voice control host unit 108 from there via a control host unit 104 and an internet 105. This voice signal is received by a mobile terminal communication control part 116 via a packet transmitting/receiving part 115 in the same unit, and after recognized in a sentence voice recognizing part 117, its search key word is extracted in a search control part 118, and a search processing is executed to a prescribed database engine. The search result HTML sentence data obtained as a result of that is returned to the mobile terminal 101 and received by the control part 110 via the communication part 111 and displayed at an output part 112. By selecting a hyper text on the displayed search result HTML sentence, a user accesses to an arbitrary resource on the internet 105.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、移動(携帯)端末
装置において入力された通話音声等の音声を認識しその
認識結果に基づいてデータベースを検索する技術、及び
インターネット上等のリソースにアクセスする技術に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technology for recognizing speech such as a call speech input in a mobile (portable) terminal device, searching a database based on the result of the recognition, and accessing resources on the Internet or the like. About technology.

【0002】[0002]

【従来の技術及び発明が解決しようとする課題】音声信
号を認識して、文字データに変換して蓄積したり、認識
結果を種々のサービスの利用に供したりするための音声
認識技術は、様々な産業分野で従来から要請されてい
る。
2. Description of the Related Art There are various voice recognition technologies for recognizing voice signals, converting them into character data and storing the data, and providing recognition results to use of various services. It has been demanded in various industrial fields.

【0003】近年では、音声認識アルゴリズムの発達に
より、メインフレームコンピュータ又はワークステーシ
ョンコンピュータ等を用いた音声認識システムが開発さ
れている。
In recent years, with the development of speech recognition algorithms, speech recognition systems using a mainframe computer or a workstation computer have been developed.

【0004】これらのシステムは、例えば、電話音声を
入力とする銀行の残高照会システムや座席予約システ
ム、作業員の音声を認識して荷物の自動配送を行う配送
荷物の仕分システムを始めとして、種々の産業分野に取
り入られつつある。
[0004] These systems include various systems such as a bank balance inquiry system and a seat reservation system using telephone voice as input, and a delivery package sorting system that recognizes workers' voices and automatically delivers packages. It is being adopted by other industrial fields.

【0005】しかし、このような音声認識システムは、
上述のような大規模なコンピュータシステムの環境のも
とでようやく実用的な認識精度を有するレベルに到達し
たばかりであり、いわゆるパーソナルコンピュータのよ
うな小型のコンピュータシステム環境のもとでは、実用
的な認識精度を有する安価な音声認識システムは未だ実
現されていないのが現状である。
However, such a speech recognition system has
Only under the environment of a large-scale computer system as described above has reached a level having practical recognition accuracy, and under the environment of a small-sized computer system such as a so-called personal computer, the practical recognition accuracy has been reached. At present, an inexpensive speech recognition system having recognition accuracy has not been realized yet.

【0006】一方、上述のような情報処理技術と並行し
て、近年、自動車電話・携帯電話やPHS(パーソナル
ハンディホンシステム)等の移動端末が、急速に普及し
つつある。
[0006] On the other hand, in parallel with the above information processing technology, mobile terminals such as car phones, mobile phones, and PHS (Personal Handy Phone System) have been rapidly spreading in recent years.

【0007】特に、PHSは、小型であると同時に、自
動車電話・携帯電話に比較して通話料金が安く、かつ、
「いつでも、どこでも、誰とでも」高い品質で通話がで
きるという特徴を備えており、爆発的に普及しつつあ
る。更に、PHSは、ISDN(Integrated Services
Digital Network:サービス統合デジタル網)をバックボ
ーンとする公衆網であるため、32キロビット/秒の伝
送レートでの高速デジタル通信が可能であり、マルチメ
ディア通信分野への応用に対する期待も高まっている。
[0007] In particular, the PHS is small in size, and at the same time, the call charge is lower than that of a car phone or a mobile phone.
It has the feature of being able to talk with high quality "anytime, anywhere, with anyone" and is exploding. In addition, PHS is an ISDN (Integrated Services)
Since it is a public network using a Digital Network (Integrated Services Digital Network) as a backbone, high-speed digital communication at a transmission rate of 32 kilobits / second is possible, and expectations for its application to the multimedia communication field are increasing.

【0008】更には、移動端末の利便性をいかすべく、
携帯電話装置としてだけではなく、携帯情報管理装置と
しても利用できるような、マルチメディア情報管理/通
信端末装置としての実現の可能性も期待されている。具
体的には、このような移動端末は、通話機能/FAX機
能を備えることはもちろん、インターネットや社内ネッ
トワークへのアクセス機能としてのホームページアクセ
ス機能や電子メール通信機能を備えることが予想される
ほか、アドレス管理、スケジュール管理、データベース
検索/蓄積等の情報管理機能をも兼ね備えることが期待
される。
Further, in order to take advantage of the convenience of the mobile terminal,
It is also expected that it can be used as a multimedia information management / communication terminal device that can be used not only as a mobile phone device but also as a mobile information management device. Specifically, such a mobile terminal is expected to have not only a call function / fax function, but also a homepage access function and an e-mail communication function as an access function to the Internet and a company network. It is expected to have information management functions such as address management, schedule management, and database search / storage.

【0009】そして、このような移動端末は、人が気軽
に利用できるよう、できる限り人にやさしく自然なユー
ザインタフェースを備えることが要請される。現在実現
されているユーザインタフェースとしては、キーボード
やマウスによる指操作入力、電子ペンによる手書き入力
等が実用化されているが、音声入力等にも対応すること
ができれば、ユーザインタフェースとして理想的であ
る。即ち例えば、基本機能としての通話機能を利用しな
がら通話内容を示す音声信号をデータとして処理し、そ
の処理結果に基づいてインターネット上のデータベース
を検索すること等が可能になれば、移動端末の利便性を
飛躍的に増大させることが可能になる。ここに、移動端
末に対してユーザインタフェースとして音声認識機能を
適用することの価値を見出すことができる。
[0009] Such a mobile terminal is required to have a natural user interface that is as gentle as possible to a person so that the user can use it easily. As user interfaces currently realized, finger operation input using a keyboard or a mouse, handwriting input using an electronic pen, and the like have been put to practical use, but if they can respond to voice input and the like, they are ideal as user interfaces. . That is, for example, if it becomes possible to process a voice signal indicating the content of a call as data while using a call function as a basic function, and to search a database on the Internet based on the processing result, etc. It is possible to dramatically increase the performance. Here, the value of applying a voice recognition function as a user interface to a mobile terminal can be found.

【0010】しかし、移動端末は小型でありその情報処
理能力は限られている反面、前述したように、現在の音
声認識処理では、メインフレームコンピュータ又はワー
クステーションコンピュータクラスの環境のもとでない
と、実用的な認識精度を実現することは困難である。従
って、現状では、移動端末のユーザインタフェースとし
て音声認識機能を実現することは非常に困難である、と
いう問題点を有している。
[0010] However, while the mobile terminal is small and has limited information processing capability, as described above, in the current speech recognition processing, the mobile terminal must be installed in a mainframe computer or workstation computer class environment. It is difficult to achieve practical recognition accuracy. Therefore, at present, there is a problem that it is very difficult to realize a voice recognition function as a user interface of a mobile terminal.

【0011】本発明の課題は、移動端末を用いた通信環
境において、そのユーザインタフェースとしての音声認
識機能を実用的な精度及びコストで実現し、インターネ
ット上でのデータベース検索及び各種リソースへのアク
セスを可能とすることにある。
An object of the present invention is to realize a speech recognition function as a user interface with practical accuracy and cost in a communication environment using a mobile terminal, and perform database search and access to various resources on the Internet. To make it possible.

【0012】[0012]

【課題を解決するための手段】本発明はまず、以下の構
成を含む移動端末を有する。即ち、ホスト接続手段(制
御部110、通信部111)は、無線網又は有線網の何
れか一方又は両方から構成される中継網(PHS網10
3とインターネット105)を介して間接的に又はその
中継網を介さずに直接的にホスト装置である音声制御ホ
スト装置(音声制御ホスト装置108)に接続する。
The present invention first has a mobile terminal having the following configuration. In other words, the host connection means (the control unit 110 and the communication unit 111) is connected to a relay network (PHS network 10) composed of one or both of a wireless network and a wired network.
3 and the Internet 105) indirectly or directly to a voice control host device (voice control host device 108) as a host device without going through a relay network.

【0013】音声入力手段(入力部109)は、音声を
入力する。音声データ送信手段(制御部110、通信部
111)は、ホスト接続手段による接続動作の後、音声
入力手段から入力される音声データを音声制御ホスト装
置に送信する。
The voice input means (input section 109) inputs voice. After the connection operation by the host connection unit, the audio data transmission unit (the control unit 110 and the communication unit 111) transmits the audio data input from the audio input unit to the audio control host device.

【0014】検索結果HTML文章データ受信手段(制
御部110、通信部111)は、音声制御ホスト装置か
ら返信されハイパーテキストマークアップ言語HTML
によって記述された検索結果HTML文章データを受信
する。
The search result HTML text data receiving means (the control unit 110 and the communication unit 111) returns the hypertext markup language HTML which is returned from the voice control host device.
Receiving the search result HTML text data described in the above.

【0015】検索結果HTML文章データ表示/処理手
段(制御部110、出力部112)は、その受信された
検索結果HTML文章データを表示及び処理する。リソ
ースアクセス処理手段(制御部110、通信部111)
は、表示される検索結果HTML文章データに含まれか
つユーザが指定したアクセス情報(ハイパーテキストに
含まれるURL)に対応するホスト装置上のリソース
(ホームページデータ、Javaアプレット、ファイル
データ、そのホスト装置のログインアカウント等)に、
中継網を介して間接的に又は中継網を介さずに直接的に
アクセスして、そのリソースを処理する。より具体的に
は、リソースアクセス処理手段は、上記アクセス情報で
あるURLにより示されるインターネット等に接続され
るホスト装置上のホームページデータやJavaアプレ
ットやファイルデータやそのホスト装置のログインアカ
ウント等の各種リソースに対し、そのURLにより指定
されるHTTP(Hyper Text Transfer Protocol)(ホ
ームページデータの取得又はJavaアプレットの取得
/実行の場合)、FTP(File TransferProtocol)
(ファイルデータの取得の場合)、又はTELNET
(ホスト装置へのログインの場合)等の通信プロトコル
を用いて、アクセスする。この場合、リソースアクセス
処理手段は、上記URLによってホームページデータや
Javaアプレットやファイルデータ等の取得又は実行
が指定されている場合には、それらを、上記HTTP又
はFTP等の通信プロトコルを用いてホスト装置から移
動端末に転送させて、表示し(ホームページデータの取
得の場合)、実行し(Javaアプレットの取得及び実
行の場合)、又は蓄積する(ファイルデータの取得の場
合)。或いは、リソースアクセス処理手段は、上記UR
Lによってホスト装置に対するログインが指定されてい
る場合は、TELNETプロトコルを用いてそのホスト
装置にログインする。
The search result HTML text data display / processing means (control unit 110, output unit 112) displays and processes the received search result HTML text data. Resource access processing means (control unit 110, communication unit 111)
Are resources (homepage data, Java applets, file data, etc.) on the host device corresponding to the access information (URL included in the hypertext) included in the displayed search result HTML text data and specified by the user. Login account)
Access the resource indirectly via the transit network or directly without transiting the transit network to process the resources. More specifically, the resource access processing means includes various resources such as homepage data, Java applets and file data on a host device connected to the Internet or the like indicated by the URL as the access information, and a login account of the host device. HTTP (Hyper Text Transfer Protocol) specified by the URL (in the case of obtaining homepage data or obtaining / executing a Java applet), FTP (File Transfer Protocol)
(For file data acquisition) or TELNET
Access is made using a communication protocol such as (in the case of login to a host device). In this case, when acquisition or execution of homepage data, Java applet, file data, or the like is specified by the URL, the resource access processing unit converts the data into a host device using the communication protocol such as HTTP or FTP. To transfer to a mobile terminal and display (in the case of acquiring homepage data), execute (in the case of acquiring and executing Java applets), or accumulate (in the case of acquiring file data). Alternatively, the resource access processing means includes the UR
When the login to the host device is designated by L, the user logs in to the host device using the TELNET protocol.

【0016】次に、本発明は、以下の構成を含む音声制
御ホスト装置108を有する。即ち、移動端末接続手段
(パケット送受信部115、移動端末通信制御部11
6)は、移動端末内のホスト接続手段による接続動作に
応答して、移動端末を識別して接続する。
Next, the present invention has a voice control host device 108 having the following configuration. That is, mobile terminal connection means (packet transmitting / receiving section 115, mobile terminal communication control section 11
6) responds to the connection operation by the host connection means in the mobile terminal, and identifies and connects the mobile terminal.

【0017】音声データ受信手段(パケット送受信部1
15、移動端末通信制御部116)は、現在接続されて
いる移動端末毎に、音声データを受信する。音声認識手
段(移動端末通信制御部116、文音声認識部117)
は、現在接続されている移動端末毎に、音声データ受信
手段により受信された音声データに対して音声認識処理
を実行する。
Voice data receiving means (packet transmitting / receiving unit 1)
15. The mobile terminal communication control unit 116) receives voice data for each currently connected mobile terminal. Voice recognition means (mobile terminal communication control unit 116, sentence voice recognition unit 117)
Executes voice recognition processing on voice data received by the voice data receiving means for each mobile terminal currently connected.

【0018】検索制御手段(検索制御部118)は、現
在接続されている移動端末毎に、音声認識手段による音
声認識処理によって得られる認識音声データから検索キ
ーワードを抽出し、その検索キーワードに対応するリソ
ースに対するアクセス情報を含む検索結果HTML文章
データを所定のデータベースシステムから検索する。こ
の所定のデータベースシステムは、例えば、インターネ
ットに接続される所定のホスト装置が提供する。
The search control means (search control unit 118) extracts a search keyword from the recognized voice data obtained by the voice recognition processing by the voice recognition means for each currently connected mobile terminal, and corresponds to the search keyword. The search result HTML text data including the access information for the resource is searched from a predetermined database system. This predetermined database system is provided, for example, by a predetermined host device connected to the Internet.

【0019】また、上述の検索制御手段は、例えば、以
下の検索インデックス作成手段、検索キーワード抽出手
段、及び検索実行手段を含む。即ちまず、検索インデッ
クス作成手段は、現在接続されている移動端末毎に、音
声認識手段による音声認識処理によって得られる認識音
声データを所定の分類規則に従って分類することによ
り、より具体的には、例えば入力されたデータ中に現れ
る各単語を出現回数の多い順に分類することによって、
検索インデックスを作成する。検索キーワード抽出手段
は、現在接続されている移動端末毎に、検索インデック
ス作成手段により作成される検索インデックスから所定
の抽出基準を満たす語句を抽出し、より具体的には、例
えば出現回数が所定回数以上の単語又は所定の出現回数
順位以上の順位の単語を抽出し、その抽出された語句か
ら所定の不要キーワードを除去し、その結果得られる語
句のうち新規のものを検索キーワードとして抽出する。
そして、検索実行手段は、検索キーワードに対応する検
索結果HTML文章データを所定のデータベースシステ
ムから検索する。なお、検索インデックスの作成処理と
不要キーワードの除去処理は、逆の順序で実行されても
よく、それも本発明の権利範囲である。
The above-mentioned search control means includes, for example, the following search index creation means, search keyword extraction means, and search execution means. That is, first, the search index creation unit classifies the recognized speech data obtained by the speech recognition processing by the speech recognition unit for each currently connected mobile terminal according to a predetermined classification rule, and more specifically, for example, By classifying the words that appear in the input data in the order of the number of occurrences,
Create a search index. The search keyword extracting means extracts a phrase satisfying a predetermined extraction criterion from a search index created by the search index creating means for each of the currently connected mobile terminals, and more specifically, for example, when the number of appearances is a predetermined number of times. The above words or words having a rank equal to or higher than a predetermined number of appearances are extracted, a predetermined unnecessary keyword is removed from the extracted phrases, and a new one of the resulting phrases is extracted as a search keyword.
Then, the search execution means searches the predetermined database system for search result HTML text data corresponding to the search keyword. Note that the search index creation processing and the unnecessary keyword removal processing may be performed in the reverse order, which is also within the scope of the present invention.

【0020】検索結果HTML文章データ返信手段(移
動端末通信制御部116、パケット送受信部115)
は、現在接続されている移動端末毎に、検索制御手段に
よる検索処理によって得られる検索結果HTML文章デ
ータを、それに対応する移動端末に返信する。
Means for returning search result HTML text data (mobile terminal communication control unit 116, packet transmission / reception unit 115)
Returns search result HTML text data obtained by the search processing by the search control means for each mobile terminal currently connected to the corresponding mobile terminal.

【0021】以上の移動端末と音声制御ホスト装置を含
む本発明による通信移動端末音声認識/データベース検
察通信システムにより、移動端末は、高度な音声認識/
データベース検索/リソースアクセス環境を設備する必
要がなく実用的な精度を有する音声認識/データベース
検索機能の提供を低コストで受けることができる。
The mobile terminal according to the present invention including the mobile terminal and the voice control host device according to the present invention can perform advanced voice recognition / database detection.
There is no need to provide a database search / resource access environment, and a speech recognition / database search function having practical accuracy can be provided at low cost.

【0022】上述の発明の構成は、下記の限定を含むこ
とができる。即ち、まず、移動端末は、パーソナルハン
ディホンシステム通信機能(通信部111)を備える。
The configuration of the invention described above can include the following limitations. That is, first, the mobile terminal has a personal handyphone system communication function (communication unit 111).

【0023】次に、中継網は、パーソナルハンディホン
システム通信網(PHS網103)とインターネット
(インターネット105)を含む。また、音声制御ホス
ト装置及び前述のアクセス情報に対応するホスト装置
は、インターネットに接続する。
Next, the relay network includes a personal handyphone system communication network (PHS network 103) and the Internet (Internet 105). The voice control host device and the host device corresponding to the above-mentioned access information are connected to the Internet.

【0024】そして、移動端末内のホスト接続手段又は
リソースアクセス処理手段は、パーソナルハンディホン
システム通信網を介して、そのパーソナルハンディホン
システム通信網を含む公衆網とインターネットとの間の
ゲートウエイ機能を有する移動端末制御ホスト装置(移
動端末制御ホスト装置104)に発信し接続することに
よって、インターネット上の通信プロトコルを使用し
て、移動端末制御ホスト装置からインターネットを介し
て音声制御ホスト装置又は前述のアクセス情報に対応す
るホスト装置に接続又はアクセスする。
The host connection means or the resource access processing means in the mobile terminal has a gateway function between the public network including the personal handyphone system communication network and the Internet via the personal handyphone system communication network. By transmitting and connecting to the mobile terminal control host device (mobile terminal control host device 104), the voice control host device or the aforementioned access information is transmitted from the mobile terminal control host device via the Internet using a communication protocol on the Internet. Or access to the host device corresponding to.

【0025】この限定構成によって、現在全国的及び全
世界的に普及しつつあるパーソナルハンディホンシステ
ム通信網及びインターネットを経由することにより、実
用的な精度を有する音声認識機能と、ワールドワイドな
データベース検索、及びその検索結果に対応するリソー
スへのアクセス機能の提供を、より低コスト及び手軽に
受けることができると同時に、本発明が提供する機能と
パーソナルハンディホンシステム通話機能及びインター
ネットアクセス機能とを、シームレスに結合することが
できる。
With this limited configuration, a voice recognition function having practical accuracy and a world-wide database search can be provided via a personal handyphone system communication network and the Internet, which are currently spreading nationwide and worldwide. , And the provision of an access function to a resource corresponding to the search result can be provided at a lower cost and easily, and at the same time, the function provided by the present invention, the personal handyphone system call function and the Internet access function, Can be seamlessly combined.

【0026】更に、ホスト接続手段が使用する通信プロ
トコルは、下記の限定を含むことができる。即ち、上記
通信プロトコルは、インターネットプロトコル(IP)
層及びトランスミッションコントロールプロトコル(T
CP)層を含む階層プロトコルである。
Further, the communication protocol used by the host connection means can include the following restrictions. That is, the communication protocol is Internet Protocol (IP)
Layer and Transmission Control Protocol (T
This is a layer protocol including a CP) layer.

【0027】次に、インターネット上を伝送されるイン
ターネットプロトコル層のパケットデータであるインタ
ーネットプロトコルデータグラム(IPデータグラム)
のヘッダ(IPヘッダ)フィールドには、インターネッ
ト上での移動端末及び音声制御ホスト装置のアドレスを
指定する送信元インターネットプロトコルアドレス及び
宛先インターネットプロトコルアドレスが格納され、そ
のインターネットプロトコルデータグラムのデータフィ
ールドには、トランスミッションコントロールプロトコ
ル層のパケットデータであるトランスミッションコント
ロールプロトコルセグメントが格納される。
Next, an Internet Protocol datagram (IP datagram) which is packet data of an Internet protocol layer transmitted on the Internet.
The header (IP header) field stores a source Internet protocol address and a destination Internet protocol address designating addresses of a mobile terminal and a voice control host device on the Internet, and the data field of the Internet protocol datagram contains And a transmission control protocol segment which is packet data of the transmission control protocol layer.

【0028】また、トランスミッションコントロールプ
ロトコルセグメント(TCPセグメント)のヘッダ(T
CPヘッダ)フィールドには、音声認識/データベース
検索処理のための通信プロトコルを特定する送信元ポー
ト番号及び宛先ポート番号が格納され、そのトランスミ
ッションコントロールプロトコルセグメントのデータフ
ィールドには、移動端末を識別するための端末識別コー
ド、音声データ、又は検索結果HTML文章データが格
納される。
The transmission control protocol segment (TCP segment) header (T
The CP header field stores a source port number and a destination port number for specifying a communication protocol for speech recognition / database search processing. The data field of the transmission control protocol segment includes a data field for identifying a mobile terminal. Terminal identification code, voice data, or search result HTML text data.

【0029】この限定構成によって、移動端末と音声制
御ホスト装置とを全世界的に容易に特定できると共に、
音声認識/データベース検索処理サービスと、その検索
結果に基づくリソースへのアクセスサービス、及びその
他の情報処理サービスとの共存を容易に実現できる。
With this limited configuration, the mobile terminal and the voice control host device can be easily specified worldwide, and
The coexistence of the voice recognition / database search processing service, the resource access service based on the search result, and other information processing services can be easily realized.

【0030】ここまでの発明の構成において、音声制御
ホスト装置は、網によって相互に接続され、移動端末接
続手段、音声データ受信手段、音声認識手段、データベ
ース手段、検索制御手段、及び検索結果HTML文章デ
ータ返信手段に対応する機能を分散して実現する複数の
ホストコンピュータから構成されるように実現すること
ができる。
In the configuration of the present invention described above, the voice control host devices are mutually connected by a network, and mobile terminal connecting means, voice data receiving means, voice recognition means, database means, search control means, and search result HTML text are provided. The present invention can be realized by a plurality of host computers that realize the functions corresponding to the data return means in a distributed manner.

【0031】この限定構成によって、ホスト装置側の負
荷分散を容易に実現できる。なお、上述した移動端末及
び音声制御ホスト装置の単体も、本発明の権利範囲であ
る。
With this limited configuration, load distribution on the host device side can be easily realized. Note that the above-described mobile terminal and voice control host device alone are also within the scope of the present invention.

【0032】[0032]

【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態について詳細に説明する。本実施の形態で
は、PHS機能が組み込まれた移動端末において、通話
時に又はオフライン状態でマイクから入力された音声信
号が、PHS網からインターネットを介して特定の音声
サービスプロバイダ内のLANに接続される音声制御ホ
スト装置に送られ、そこで上記音声信号が認識された
後、その認識結果が自動的に分類され、その分類結果に
基づいてインターネット上の特定のデータベース検索エ
ンジンがアクセスされ、そこでのデータベースが検索さ
れる。この結果、音声制御ホスト装置は、移動端末で入
力された音声の内容に関連するデータベース情報をイン
ターネットから取得し、それをリアルタイムに移動端末
に返送する。このデータベース情報は、移動端末で入力
された音声の内容に関連するキーワードを含むインター
ネット上のホームページ等の各種リソースに対する統一
形式アクセス情報であるURLが記述されているハイパ
ーテキストを含むHTML文章(検索結果HTML文章
データ)として表現される。移動端末は、この検索結果
HTML文章データを受信すると、ホームページの閲覧
のためのブラウザアプリケーションを起動し、上述の検
索結果HTML文章データをホームページ形式で表示す
る。移動端末のユーザは、ハイパーテキストの一部とし
て表示されたアンカー(テキストアンカー又はグラフィ
ックスアンカー)を電子ペンでタッチ等して選択するこ
とによって、そのアンカーと共にハイパーテキストに含
まれるURLに対応するインターネット上のホームペー
ジやJavaアプレットやファイルやホスト装置のログ
インアカウント等の各種リソースにアクセスし、移動端
末に転送する必要のある場合には、それらのリソース
を、移動端末101に転送した後、表示、実行、又は蓄
積することができる。このように、本実施の形態では、
移動端末は、高度な音声認識環境を設備する必要がなく
実用的な精度を有する音声認識機能の提供を低コストで
受けることができ、かつインターネット上のデータベー
スの対話的検索機能をも装備することができることが、
本発明に関連する大きな特徴である。 <システム構成>図1は、本発明の実施の形態の全体シ
ステム構成図である。
Embodiments of the present invention will be described below in detail with reference to the drawings. In the present embodiment, in a mobile terminal having a built-in PHS function, a voice signal input from a microphone during a call or in an off-line state is connected to a LAN in a specific voice service provider from the PHS network via the Internet. After being sent to the voice control host device, where the voice signal is recognized, the recognition result is automatically classified, and a specific database search engine on the Internet is accessed based on the classification result, and the database there is searched. Searched. As a result, the voice control host device obtains database information related to the content of voice input at the mobile terminal from the Internet, and returns it to the mobile terminal in real time. The database information includes an HTML sentence including a hypertext in which a URL that is a unified format access information for various resources such as a homepage on the Internet including a keyword related to the content of the voice input by the mobile terminal is described (search result). (HTML text data). Upon receiving the search result HTML text data, the mobile terminal activates a browser application for browsing a home page, and displays the above-described search result HTML text data in a home page format. The user of the mobile terminal selects an anchor (text anchor or graphics anchor) displayed as a part of the hypertext by touching the electronic pen or the like with an electronic pen or the like, and the Internet corresponding to the URL included in the hypertext together with the anchor. When it is necessary to access various resources such as the above homepage, Java applet, file, and login account of the host device and transfer them to the mobile terminal, transfer those resources to the mobile terminal 101, and then display and execute the resources. Or can be accumulated. Thus, in the present embodiment,
The mobile terminal must be able to provide a voice recognition function with practical accuracy at a low cost without having to install an advanced voice recognition environment, and also be equipped with an interactive database search function on the Internet. Can do
This is a major feature related to the present invention. <System Configuration> FIG. 1 is an overall system configuration diagram of an embodiment of the present invention.

【0033】移動端末101は、PHS端末機能を有し
ており、無線基地102を介して、無線通信によってP
HS網103に接続される。無線基地102は、街路の
公衆電話ボックス、電柱、ビル屋上、地下通路等に設け
られる公衆無線基地、又は加入者宅内の親子電話装置等
である。なお、親子電話装置に接続される場合は、PH
S網を介さずに、直接公衆電話網に接続される。なお、
無線基地102の代わりに、有線接続装置を介して、有
線通信によってPHS網103又は公衆電話網に接続さ
れるように構成されてもよい。
[0033] The mobile terminal 101 has a PHS terminal function.
It is connected to the HS network 103. The wireless base 102 is a public wireless base provided on a public telephone booth, a telephone pole, a building rooftop, an underground passage, or the like on a street, or a parent-child telephone device in a subscriber's house. When connected to the parent-child telephone device, the PH
It is directly connected to the public telephone network without going through the S network. In addition,
Instead of the wireless base 102, a configuration may be adopted in which the wireless base 102 is connected to the PHS network 103 or the public telephone network by wired communication via a wired connection device.

【0034】PHS網103は、公衆電話網又はISD
N網と相互接続しており、これらの網には、高速デジタ
ル専用線等によってインターネット105に接続してい
る移動端末制御ホスト装置104が接続されている。
The PHS network 103 is a public telephone network or an ISD
It is interconnected with N networks, and a mobile terminal control host device 104 connected to the Internet 105 by a high-speed digital leased line or the like is connected to these networks.

【0035】移動端末101は、無線基地102及びP
HS網103を介して、上記公衆電話網又はISDN網
に接続されている移動端末制御ホスト装置104に自動
的にダイヤルアップ発信することによって、インターネ
ット105に接続することができる。
The mobile terminal 101 is connected to the radio base 102 and the P
By automatically dialing up the mobile terminal control host device 104 connected to the public telephone network or the ISDN network via the HS network 103, it is possible to connect to the Internet 105.

【0036】インターネット105には、高速デジタル
専用線等を介して所定の音声サービスプロバイダのLA
N107に接続しているルータ装置106が接続されて
いる。LAN107は、イーサネット方式、ATM(As
ynchronous Transfer Mode)方式、又はFDDI方式に
よるローカルエリアネットワークである。LAN107
には、更に音声制御ホスト装置108が接続されてい
る。
A predetermined voice service provider LA is connected to the Internet 105 via a high-speed digital leased line or the like.
The router device 106 connected to N107 is connected. LAN 107 is an Ethernet system, ATM (As
Synchronous Transfer Mode) or FDDI. LAN 107
Is connected to a voice control host device 108.

【0037】移動端末101は、移動端末制御ホスト装
置104に自動的にダイヤルアップ発信した後に、イン
ターネット105、ルータ装置106、及びLAN10
7を介して、音声制御ホスト装置108と通信すること
ができる。
After automatically dialing up the mobile terminal 101 to the mobile terminal control host device 104, the mobile terminal 101 sends the Internet 105, the router device 106, and the LAN 10
7 can communicate with the voice control host device 108.

【0038】今、移動端末101内の入力部109にお
いて、ユーザが、タッチパネルから音声制御ホスト装置
108との通信を指示すると、制御部110は、通信部
111に対して、音声制御ホスト装置108との通信開
始を依頼する。
Now, when the user instructs communication with the voice control host device 108 from the touch panel on the input unit 109 in the mobile terminal 101, the control unit 110 sends a command to the communication unit 111 with the voice control host device 108. Request to start communication.

【0039】通信部111は、制御部110から通信開
始を依頼されると、現在移動端末制御ホスト装置104
に接続していなければ、無線基地(又は有線接続装置)
102に無線(又は有線)発信してPHS網103に接
続した後、移動端末制御ホスト装置104のアクセス電
話番号を指定してダイヤルアップ発信する。
When the communication unit 111 is requested by the control unit 110 to start communication, the current mobile terminal control host device 104
If not connected to a wireless base (or wired connection device)
After making a wireless (or wired) call to 102 and connecting to the PHS network 103, a dial-up call is made by specifying the access telephone number of the mobile terminal control host device 104.

【0040】移動端末制御ホスト装置104が着信する
と、移動端末101内の通信部111は、まず、移動端
末制御ホスト装置104内の接続確立部113と通信す
ることにより、インターネット105上の標準通信プロ
トコルであるTCP/IP及びPPP方式による接続の
確立のためのネゴシエーションを行う。この結果、移動
端末制御ホスト装置104から、移動端末101内の通
信部111に対して、インターネット105上の識別ア
ドレスであるIPアドレスが付与され、移動端末101
は、インターネット105へのアクセスが可能となる。
When the mobile terminal control host device 104 receives an incoming call, the communication unit 111 in the mobile terminal 101 first communicates with the connection establishment unit 113 in the mobile terminal control host device 104, thereby establishing a standard communication protocol on the Internet 105. Negotiation for establishing a connection by the TCP / IP and PPP methods. As a result, an IP address, which is an identification address on the Internet 105, is assigned from the mobile terminal control host device 104 to the communication unit 111 in the mobile terminal 101, and the mobile terminal 101
Can access the Internet 105.

【0041】移動端末101内の通信部111は、既に
移動端末制御ホスト装置104に接続していれば、上記
タイヤルアップ発信は省略する。その後、移動端末10
1内の通信部111は、予め設定されている音声制御ホ
スト装置108のIPアドレスである“宛先IPアドレ
ス”と、移動端末制御ホスト装置104から付与された
IPアドレスである“送信元IPアドレス”と、移動端
末101を識別するための“端末識別コード”(例えば
PHS電話番号)と、ユーザの指定に基づく文音声認識
/データベース検索処理の開始要求コマンド又は文音声
認識/データベース検索処理の終了要求コマンドとが格
納されたTCP/IPパケットを、インターネット10
5に向けて送出する。
If the communication unit 111 in the mobile terminal 101 is already connected to the mobile terminal control host device 104, the above dial-up transmission is omitted. Then, the mobile terminal 10
1 includes a “destination IP address” that is a preset IP address of the voice control host device 108 and a “source IP address” that is an IP address assigned by the mobile terminal control host device 104. And a "terminal identification code" (for example, a PHS telephone number) for identifying the mobile terminal 101, and a command to start a sentence speech recognition / database search process or a request to end a sentence speech recognition / database search process based on a user's designation. The TCP / IP packet storing the command and the
Send it out to 5.

【0042】このTCP/IPパケットは、それに格納
されている“宛先IPアドレス”に基づき、移動端末制
御ホスト装置104内のルーティング部114とインタ
ーネット105内の特には図示しない中継ホスト装置に
よって、音声サービスプロバイダ内のルータ装置106
まで転送された後、更に、LAN107を介して音声制
御ホスト装置108内のパケット送受信部115まで転
送される。
Based on the “destination IP address” stored in the TCP / IP packet, a voice service is provided by a routing unit 114 in the mobile terminal control host device 104 and a relay host device (not shown) in the Internet 105. Router device 106 in the provider
After that, the packet is further transferred to the packet transmitting / receiving unit 115 in the voice control host device 108 via the LAN 107.

【0043】パケット送受信部115は、受信したTC
P/IPパケットから、“送信元IPアドレス”と、
“端末識別コード”と、文音声認識/データベース検索
処理の開始要求コマンド又は文音声認識/データベース
検索処理の終了要求コマンドとを取り出して、音声制御
ホスト装置108内の移動端末通信制御部116に引き
渡す。
Packet transmitting / receiving section 115 receives the received TC
From the P / IP packet, the “source IP address”
The terminal identification code and the sentence speech recognition / database search processing start request command or the sentence speech recognition / database search processing end request command are extracted and transferred to the mobile terminal communication control unit 116 in the speech control host device 108. .

【0044】移動端末通信制御部116は、引き渡され
た“送信元IPアドレス”と、“端末識別コード”と、
文音声認識/データベース検索処理の開始要求コマンド
又は文音声認識/データベース検索処理の終了要求コマ
ンドに関する情報を後述する処理端末登録テーブル(図
12)に登録した後、パケット送受信部115に対し
て、送信許可データが格納されたTCP/IPパケット
の移動端末101への返信を依頼する。
The mobile terminal communication control unit 116 transmits the delivered “source IP address”, “terminal identification code”,
After registering information relating to a start command of the sentence speech recognition / database search process or an end request command of the sentence speech recognition / database search process in a processing terminal registration table (FIG. 12) described later, the information is transmitted to the packet transmitting / receiving unit 115 A request is sent to the mobile terminal 101 to return a TCP / IP packet storing the permission data.

【0045】パケット送受信部115は、対応するTC
P/IPパケットを、移動端末101に対応するIPア
ドレスに向けて送信する。このようにして、音声制御ホ
スト装置108は、移動端末101から転送されてくる
音声データに対して文音声認識/データベース検索処理
を実行することが可能となる。
The packet transmitting / receiving unit 115
The P / IP packet is transmitted to the IP address corresponding to the mobile terminal 101. In this way, the voice control host device 108 can execute sentence voice recognition / database search processing on voice data transferred from the mobile terminal 101.

【0046】移動端末101内の通信部111は、音声
制御ホスト装置108から上記送信許可データが格納さ
れたTCP/IPパケットを受信すると、それに格納さ
れている送信許可データを制御部110に引き渡す。
When the communication unit 111 in the mobile terminal 101 receives a TCP / IP packet storing the above-mentioned transmission permission data from the voice control host device 108, it passes the transmission permission data stored therein to the control unit 110.

【0047】移動端末101内の制御部110は、上記
送信許可データを引き渡された後、通信部111に対し
て、通話動作又はオフライン状態での音声入力動作によ
ってマイクから入力された音声データの音声制御ホスト
装置108への送信を依頼する。
After the transmission permission data is delivered, the control unit 110 in the mobile terminal 101 sends the voice of the voice data input from the microphone to the communication unit 111 by a call operation or a voice input operation in an offline state. Request transmission to the control host device 108.

【0048】通信部111は、上記音声データが格納さ
れたTCP/IPパケットを、音声制御ホスト装置10
8に対応するIPアドレスに向けて送信する。このTC
P/IPパケットは、それに格納されている“宛先IP
アドレス”に基づき、移動端末制御ホスト装置104内
のルーティング部114、インターネット105内の特
には図示しない中継ホスト装置、音声サービスプロバイ
ダ内のルータ装置106、及びLAN107を介して、
音声制御ホスト装置108内のパケット送受信部115
まで転送される。
The communication unit 111 transmits the TCP / IP packet storing the voice data to the voice control host device 10.
8 is transmitted to the IP address corresponding to No. 8. This TC
The P / IP packet has the “destination IP” stored therein.
Based on the address, via the routing unit 114 in the mobile terminal control host device 104, the relay host device (not shown) in the Internet 105, the router device 106 in the voice service provider, and the LAN 107,
Packet transmission / reception unit 115 in voice control host device 108
Transferred to

【0049】パケット送受信部115は、受信したTC
P/IPパケットに格納されている音声データを取り出
し、それを音声制御ホスト装置108内の移動端末通信
制御部116に引き渡す。
The packet transmitting / receiving unit 115 receives the received TC
The voice data stored in the P / IP packet is extracted and delivered to the mobile terminal communication control unit 116 in the voice control host device 108.

【0050】移動端末通信制御部116は、引き渡され
た音声データを文音声認識部117に引き渡す。文音声
認識部117は、引き渡された音声データに対し文音声
認識処理を実行し、認識結果である認識音声文章データ
を検索制御部118に引き渡す。検索制御部118は、
認識音声文章データを、移動端末101別にインデック
ス分類し、その結果得られる検索インデックスに基づき
不要キーワード辞書を参照しながら検索キーワードを抽
出する。そして、検索制御部118は、インターネット
105上の予め登録されている特定のデータベース検索
エンジンに対して、検索キーワードによる問合せを依頼
する。その結果、検索制御部118は、データベース検
索エンジンから返される検索結果に基づき検索結果HT
ML文章データを生成し、それを移動端末通信制御部1
16に引き渡す。この検索結果HTML文章データは、
移動端末101で入力された音声の内容に関連する上記
検索キーワードを含むインターネット105上の任意の
ホームページ等の各種リソースに対する統一形式アクセ
ス情報であるURL(Uniform Resource Locator)が記
述されているハイパーテキストを含むハイパーテキスト
マークアップランゲージHTMLである。
The mobile terminal communication control section 116 delivers the delivered voice data to the sentence voice recognition section 117. The sentence speech recognition unit 117 executes a sentence speech recognition process on the delivered speech data, and delivers the recognized speech sentence data as the recognition result to the search control unit 118. The search control unit 118
Recognized speech text data is classified into indices for each mobile terminal 101, and a search keyword is extracted based on a search index obtained as a result while referring to an unnecessary keyword dictionary. Then, the search control unit 118 requests a specific database search engine registered in advance on the Internet 105 to make an inquiry using the search keyword. As a result, the search control unit 118 uses the search result HT based on the search result returned from the database search engine.
Generates ML text data and transmits it to the mobile terminal communication control unit 1
Hand over to 16. This search result HTML text data is
A hypertext in which a URL (Uniform Resource Locator), which is unified format access information for various resources such as an arbitrary homepage on the Internet 105 including the above-described search keyword related to the content of the voice input by the mobile terminal 101, is described. Includes Hypertext Markup Language HTML.

【0051】今、例えば、移動端末101におけるPH
S通話において、図17に示されるような会話がやりと
りされたとする。これに対して、文音声認識部117
は、途中経過として、図18に示されるような認識音声
文章データを出力する。なお、“*”は、文音声認識部
117によって付加される単語の区切りである。この認
識音声文章データを入力した検索制御部118は、途中
経過として、例えば、図19に示されるような検索イン
デックスを作成して、その中で例えば出現回数が2回を
超えた単語“時計”及び“カシオ”を、検索キーワード
として抽出する。そして、この検索キーワード(アンド
条件)によるインターネット105上の特定のデータベ
ース検索エンジンに対する問合せの結果として、図20
に示されるような検索結果HTML文章データを生成す
る。このHTMLデータにおいて、例えば、“<A HREF
="http://www.casio.co.jp/">カシオホームページ</A
>”がカシオホームページに対応するハイパーテキスト
で、"http://www.casio.co.jp/"が上記ホームページの
URLを示し、“カシオホームページ”がそのURLに
アクセスするためのテキストアンカーを示している。上
記URLは、アドレス情報“www.casio.co.jp/”と、そ
のアドレスのリソースにアクセスするための通信プロト
コル情報“http”とを含む。また、それに続く“<DD>”
以降の文章が、上述のデータベース検索エンジンから自
動的に得られる説明文である。なお、“ <”と“> ”で
囲まれた記号は、表示制御用の記号である。
Now, for example, the PH in the mobile terminal 101
It is assumed that a conversation as shown in FIG. 17 has been exchanged in the S call. On the other hand, the sentence speech recognition unit 117
Outputs recognized speech sentence data as shown in FIG. Note that “*” is a word segment added by the sentence speech recognition unit 117. The search control unit 118 that has input the recognized voice sentence data creates a search index as shown in FIG. 19, for example, as the progress, and in the search index, the word “clock” in which the number of appearances exceeds two, for example, And “Casio” are extracted as search keywords. As a result of an inquiry to a specific database search engine on the Internet 105 using the search keyword (and condition), FIG.
The search result HTML text data as shown in FIG. In this HTML data, for example, “<A HREF
= "http://www.casio.co.jp/"> Casio homepage </ A
“>” Is a hypertext corresponding to the Casio homepage, “http://www.casio.co.jp/” indicates the URL of the above homepage, and “Casio homepage” indicates a text anchor for accessing the URL. The URL includes address information “www.casio.co.jp/” and communication protocol information “http” for accessing a resource of the address, and “<DD>” following the communication information.
The following sentence is an explanatory sentence automatically obtained from the above-described database search engine. The symbols enclosed by “<” and “>” are display control symbols.

【0052】移動端末通信制御部116は、検索結果H
TML文章データが格納されたTCP/IPパケットの
移動端末101への返信を依頼する。パケット送受信部
115は、対応するTCP/IPパケットを、移動端末
101に対応するIPアドレスに向けて送信する。
The mobile terminal communication control unit 116 searches the search result H
A request is sent to the mobile terminal 101 to return a TCP / IP packet storing the TML text data. Packet transmitting / receiving section 115 transmits a corresponding TCP / IP packet to an IP address corresponding to mobile terminal 101.

【0053】移動端末101内の通信部111は、音声
制御ホスト装置108から上記検索結果HTML文章デ
ータが格納されたTCP/IPパケットを受信すると、
それに格納されている検索結果HTML文章データを制
御部110に引き渡す。
When the communication unit 111 in the mobile terminal 101 receives a TCP / IP packet storing the above search result HTML text data from the voice control host device 108,
The search result HTML text data stored therein is delivered to the control unit 110.

【0054】移動端末101内の制御部110は、ブラ
ウザアプリケーションを起動して、引き渡された検索結
果HTML文章データを、ホームページ形式でLCD表
示部に表示する。
The control unit 110 in the mobile terminal 101 activates a browser application and displays the delivered search result HTML text data on the LCD display unit in a homepage format.

【0055】今、例えば、前述の図20に示される検索
結果HTML文章データが受信されると、LCD表示部
311(図2の203)には、例えば図21のように検
索結果が表示される。ここで、下線が付加されたキーワ
ードが、インターネット105上のホームページ等の各
種リソースのURLと共にハイパーテキストに含まれる
テキストアンカーを示している。
Now, for example, when the search result HTML text data shown in FIG. 20 is received, the search result is displayed on the LCD display unit 311 (203 in FIG. 2), for example, as shown in FIG. . Here, the underlined keyword indicates the text anchor included in the hypertext together with the URL of various resources such as a homepage on the Internet 105.

【0056】移動端末101のユーザが、上述のように
表示されたアンカーを電子ペンでタッチ等することによ
り選択すると、移動端末101は、ブラウザアプリケー
ションの機能により、移動端末制御ホスト装置104を
介し、上記アンカーと共にハイパーテキストに含まれる
URLにより示されるインターネット105に接続され
るホスト装置上のホームページデータやJavaアプレ
ットやファイルデータやホスト装置のログインアカウン
ト等の各種リソースに対し、そのURLにより指定され
るHTTP(Hyper Text Transfer Protocol)(ホーム
ページデータの取得又はJavaアプレットの取得及び
実行の場合)、FTP(File TransferProtocol)(フ
ァイルデータの取得の場合)、又はTELNET(ホス
ト装置へのログインの場合)等の通信プロトコルを用い
て、アクセスする。この場合、移動端末101は、上記
URLによってホームページデータやJavaアプレッ
トやファイルデータ等の取得又は実行が指定されている
場合には、それらを、上記HTTP又はFTP等の通信
プロトコルを用いてホスト装置から移動端末101に転
送させて、LCD表示部311(図2の203)に表示
し(ホームページデータの取得の場合)、CPU316
に実行させ(Javaアプレットの取得及び実行の場
合)、又はRAM317に蓄積する(ファイルデータの
取得の場合)。或いは、移動端末101は、上記URL
によってホスト装置に対するログインが指定されている
場合は、TELNETプロトコルを用いてそのホスト装
置にログインする。
When the user of the mobile terminal 101 selects the anchor displayed as described above by touching it with an electronic pen or the like, the mobile terminal 101 uses the function of the browser application to transmit the anchor via the mobile terminal control host device 104, For various resources such as homepage data, Java applets and file data on the host device connected to the Internet 105 indicated by a URL included in the hypertext together with the anchor, and a login account of the host device, HTTP specified by the URL is used. Communication such as (Hyper Text Transfer Protocol) (for acquiring homepage data or acquiring and executing a Java applet), FTP (File Transfer Protocol) (for acquiring file data), or TELNET (for logging in to a host device) Access using protocol. In this case, when acquisition or execution of homepage data, Java applet, file data, or the like is specified by the URL, the mobile terminal 101 transmits the data from the host device using the communication protocol such as HTTP or FTP. The data is transferred to the mobile terminal 101 and displayed on the LCD display unit 311 (203 in FIG. 2) (in the case of acquiring homepage data).
(In the case of acquiring and executing a Java applet) or storing it in the RAM 317 (in the case of acquiring file data). Alternatively, the mobile terminal 101 uses the URL
When the login to the host device is designated by the, the login to the host device is performed using the TELNET protocol.

【0057】今、図21に示される検索結果の表示画面
上で、ユーザが、例えば、テキストアンカー“WATCH WA
TCHES!”を選択すると、URL“http://www.casio.co.
jp”を有するインターネット105上のホスト装置内の
“ww”ディレクトリから、HTTP通信プロトコルを用
いて、図22に示されるようなホームページが取得さ
れ、LCD表示部311(図2の203)に表示され
る。同様に、ユーザが、例えば、テキストアンカー“カ
シオホームページ”を選択すると、URL“http://ww
w.casio.co.jp”を有するインターネット105上のホ
スト装置内の“/ ”ディレクトリ(Webルートディレ
クトリ)から、図23に示されるようなホームページが
取得され、LCD表示部311(図2の203)に表示
される。 <移動端末101の外観構成>図2は、図1の移動端末
101の外観図である。
Now, on the search result display screen shown in FIG. 21, the user can input, for example, a text anchor " WATCH WA ".
TCHES! ”, The URL“ http://www.casio.co.
From the “ww” directory in the host device on the Internet 105 having “jp”, a home page as shown in FIG. 22 is obtained using the HTTP communication protocol, and displayed on the LCD display unit 311 (203 in FIG. 2). Similarly, when the user selects, for example, the text anchor “Casio homepage”, the URL “http: // ww
A home page as shown in FIG. 23 is obtained from a “/” directory (Web root directory) in the host device on the Internet 105 having “w.casio.co.jp”, and is displayed on the LCD display unit 311 (203 in FIG. 2). <External Configuration of Mobile Terminal 101> FIG. 2 is an external view of the mobile terminal 101 shown in FIG.

【0058】移動端末101は、コンパクトな携帯情報
管理装置の外観を有し、音声を入力するための送話器を
兼ねたマイク201と、本発明には特には関連しないが
画像を入力するためのカメラ202と、各種情報を表示
し、またタッチ入力又はペン入力を受け付けるタッチパ
ネル機能を有するLCD表示部203と、音声を出力す
るための受話器を兼ねたスピーカ204を有する、ま
た、図1の無線基地102に発信するための無線アンテ
ナ205と、無線基地102の代わりの有線接続装置に
接続するためのソケット206を有する。
The mobile terminal 101 has the appearance of a compact portable information management device, and has a microphone 201 also serving as a transmitter for inputting voice, and a microphone 201 for inputting an image which is not particularly related to the present invention. 1. The camera 202, an LCD display unit 203 having a touch panel function of displaying various information and receiving a touch input or a pen input, and a speaker 204 also serving as a receiver for outputting voice. It has a wireless antenna 205 for transmitting to the base 102 and a socket 206 for connecting to a wired connection device instead of the wireless base 102.

【0059】更に、各種ICカードを挿入するためのI
Cカードスロット207と、他の移動端末101又はパ
ーソナルコンピュータ等との間で赤外線光通信を行うた
めの光送受信機208を有する。
Further, an I for inserting various IC cards is provided.
An optical transceiver 208 for performing infrared optical communication between the C card slot 207 and another mobile terminal 101 or a personal computer or the like is provided.

【0060】スイッチ209は、電源スイッチである。 <移動端末101の機能ブロック構成>図3は、移動端
末101の機能ブロック図である。
The switch 209 is a power switch. <Functional Block Configuration of Mobile Terminal 101> FIG. 3 is a functional block diagram of the mobile terminal 101.

【0061】移動端末101は、図1にも示したよう
に、入力部109、制御部110、通信部111、及び
出力部112から構成され、それぞれバス326によっ
て相互に接続されている。
As shown in FIG. 1, the mobile terminal 101 comprises an input unit 109, a control unit 110, a communication unit 111, and an output unit 112, and are mutually connected by a bus 326.

【0062】まず、入力部109は、音声を入力する部
分と、本発明には特には関連しないが画像を入力する部
分と、出力部112の動作において後述するタッチパネ
ル機構の部分とから構成される。
First, the input unit 109 includes a part for inputting voice, a part for inputting an image which is not particularly related to the present invention, and a part of a touch panel mechanism described later in the operation of the output unit 112. .

【0063】音声を入力する部分は、マイク301、A
/D変換部302、及びマイク制御部303から構成さ
れる。マイク301(図2の201に対応)は、PHS
電話の送話器を兼ねており、ユーザが発声した音声を入
力する。
The part for inputting voice is the microphone 301, A
It comprises a / D conversion unit 302 and a microphone control unit 303. The microphone 301 (corresponding to 201 in FIG. 2) is a PHS
Also serves as a telephone transmitter, and inputs a voice uttered by the user.

【0064】A/D変換部302は、マイク301から
入力されたアナログ音声信号をデジタル音声データに変
換し、更にそのデジタル音声データを、PHSの標準音
声符号化方式であるADPCM(Adaptive Differentia
l Pulse Code Modulation:適応差分線形パルス符号化)
方式によって符号化する。なお、この部分は、PHS端
末を構成するLSI集積回路として、既に実用化されて
いる。
The A / D converter 302 converts an analog audio signal input from the microphone 301 into digital audio data, and further converts the digital audio data into an ADPCM (Adaptive Differential) which is a PHS standard audio encoding system.
l Pulse Code Modulation: Adaptive differential linear pulse coding
Encode according to the method. This part has already been put to practical use as an LSI integrated circuit constituting a PHS terminal.

【0065】マイク制御部303は、上述の符号化され
た音声データを、通話時には、通信部111内の通信制
御部321に転送して通話チャネルに載せると共に、文
音声認識/データベース検索処理時には、更に制御部1
10内のRAM317に転送する。
The microphone control unit 303 transfers the encoded voice data to the communication control unit 321 in the communication unit 111 during a call and places it on a call channel. Control unit 1
10 to the RAM 317.

【0066】一方、画像を入力する部分は、CCD(Ch
arge Coupled Device )カメラ304、A/D変換部3
05、メモリ306、及びカメラ制御部307から構成
される。
On the other hand, a portion for inputting an image is a CCD (Ch
arge Coupled Device) Camera 304, A / D converter 3
05, a memory 306, and a camera control unit 307.

【0067】CCDカメラ304は、ユーザの操作に基
づいて任意の画像を撮像する。A/D変換部305は、
CCDカメラ304によって撮像されたアナログ映像信
号を、デジタル画像データに変換する。
The CCD camera 304 captures an arbitrary image based on a user operation. The A / D conversion unit 305
An analog video signal captured by the CCD camera 304 is converted into digital image data.

【0068】メモリ306は、デジタル画像データをフ
レーム単位で記憶する。カメラ制御部307は、CCD
カメラ304、A/D変換部305、及びメモリ306
の動作を制御する。
The memory 306 stores digital image data in frame units. The camera control unit 307 includes a CCD
Camera 304, A / D converter 305, and memory 306
Control the operation of.

【0069】次に、出力部112は、音声を出力する部
分と、画像を出力する部分とから構成される。音声を出
力する部分は、スピーカ308、D/A変換部309、
及びスピーカ制御部310から構成される。
Next, the output section 112 includes a section for outputting sound and a section for outputting an image. The part that outputs audio includes a speaker 308, a D / A converter 309,
And a speaker control unit 310.

【0070】スピーカ制御部310は、通信部111内
の通信制御部321から受信されたPHS通話音声デー
タ、又は制御部110内のRAM317から受信された
合成音声データを、D/A変換部309に転送する。
The speaker control section 310 transmits the PHS telephone call voice data received from the communication control section 321 in the communication section 111 or the synthesized voice data received from the RAM 317 in the control section 110 to the D / A conversion section 309. Forward.

【0071】D/A変換部309は、受信された音声デ
ータを復号し、アナログ音声信号に変換し、それをスピ
ーカ308(図2の204に対応)から音声として放音
させる。
The D / A converter 309 decodes the received audio data, converts it into an analog audio signal, and emits it as sound from the speaker 308 (corresponding to 204 in FIG. 2).

【0072】画像を出力する部分は、LCD表示部20
3、LCDドライバ312、メモリ313、及びLCD
制御部314から構成される。LCD制御部314は、
制御部110内のRAM317から受信された文字デー
タ、イメージデータ、コマンドボタンデータ等の各種画
像データをメモリ313にフレーム単位で保持させ、L
CDドライバ312に起動をかける。
The part for outputting the image is the LCD display unit 20
3, LCD driver 312, memory 313, and LCD
It comprises a control unit 314. The LCD control unit 314
Various image data such as character data, image data, and command button data received from the RAM 317 in the control unit 110 are stored in the memory 313 in frame units.
The CD driver 312 is started.

【0073】LCDドライバ312は、メモリ313か
らフレーム単位で読み出される画像データを、LCD表
示部311(図2の203に対応)に表示する。なお、
LCD表示部311(図2の203)の表面には、透明
タッチパネルが配設されており、ユーザは、LCD表示
部311に表示されるコマンドボタンデータ等に従っ
て、タッチパネルに指タッチ又はペンタッチすることに
より、コマンド入力を行うことができる。この入力信号
は、タッチパネル制御部315によって制御部110内
のRAM317に転送される。
The LCD driver 312 displays the image data read from the memory 313 in frame units on the LCD display unit 311 (corresponding to 203 in FIG. 2). In addition,
A transparent touch panel is provided on the surface of the LCD display unit 311 (203 in FIG. 2). The user touches the touch panel with his / her finger or pen in accordance with command button data displayed on the LCD display unit 311. Command input. This input signal is transferred by the touch panel control unit 315 to the RAM 317 in the control unit 110.

【0074】続いて、制御部110は、CPU316、
RAM317、及びROM318と、ICカードインタ
フェース部319、及び必要に応じてICカードスロッ
ト207(図2)に挿入されるICカード320とから
構成される。
Subsequently, the control unit 110 controls the CPU 316,
It comprises a RAM 317 and a ROM 318, an IC card interface unit 319, and an IC card 320 inserted into an IC card slot 207 (FIG. 2) as required.

【0075】CPU316は、ROM318に記憶され
た制御プログラムに従って、RAM317をワークエリ
アとして使用しながら、移動端末101全体の動作を制
御する。
The CPU 316 controls the operation of the entire mobile terminal 101 according to the control program stored in the ROM 318 while using the RAM 317 as a work area.

【0076】ICカードインタフェース部319は、I
Cカード320に対するデータの入出力を制御する。最
後に、通信部111は、通信制御部321、無線ドライ
バ322、無線アンテナ323、有線ドライバ324、
及びソケット325から構成される。
The IC card interface unit 319
The input / output of data to / from the C card 320 is controlled. Lastly, the communication unit 111 includes a communication control unit 321, a wireless driver 322, a wireless antenna 323, a wired driver 324,
And a socket 325.

【0077】通信制御部321は、PHS通話処理及び
インターネット105との間のTCP/IP通信処理
(後述する)を実行し、無線ドライバ322又は有線ド
ライバ324を制御する。
The communication control unit 321 executes a PHS call process and a TCP / IP communication process (to be described later) with the Internet 105, and controls the wireless driver 322 or the wired driver 324.

【0078】無線ドライバ322は、無線通信時に、通
信データを、無線アンテナ323(図2の205に対
応)を介して送受信されるPHS無線信号との間で相互
変換する。PHS無線信号は、1.9GHzの無線周波
数と、300kHzのキャリア周波数間隔と、4チャネ
ル/キャリアのTDMA−TDD無線アクセス方式と、
π/4シフトQPSK変調方式と、384kbits/
secの無線伝送速度に基づく無線信号である。
The wireless driver 322 mutually converts communication data with a PHS wireless signal transmitted / received via the wireless antenna 323 (corresponding to 205 in FIG. 2) during wireless communication. The PHS radio signal has a radio frequency of 1.9 GHz, a carrier frequency interval of 300 kHz, a TDMA-TDD radio access scheme of 4 channels / carrier,
π / 4 shift QPSK modulation method and 384 kbits /
This is a wireless signal based on the wireless transmission speed of sec.

【0079】一方、有線ドライバ324は、有線通信時
に、通信データを、ソケット325(図2の206に対
応)を介して送受信される有線信号との間で相互変換す
る。これは、一般的な電話帯域モデム変調信号である。
以上の構成を有する本発明の実施の形態の動作につい
て、以下に詳細に説明する。 <移動端末101の処理>まず、移動端末101の処理
について説明する。
On the other hand, at the time of wired communication, the wired driver 324 mutually converts communication data with a wired signal transmitted / received via the socket 325 (corresponding to 206 in FIG. 2). This is a typical telephone band modem modulated signal.
The operation of the embodiment of the present invention having the above configuration will be described in detail below. <Process of Mobile Terminal 101> First, the process of the mobile terminal 101 will be described.

【0080】図4は、図3の制御部110内のCPU3
16が、電源投入後に、制御部110内のROM318
に記憶されている制御プログラムを実行する動作として
実現される制御動作を示す全体動作フローチャートであ
る。
FIG. 4 shows the CPU 3 in the control unit 110 shown in FIG.
16 stores the ROM 318 in the control unit 110 after the power is turned on.
4 is an overall operation flowchart showing a control operation realized as an operation of executing a control program stored in the control program.

【0081】なお、図4、図5、及び図8の動作フロー
チャートで示される各機能を実現する制御プログラム及
びそれに必要なデータは、例えば、図2に示されるIC
カードスロット207に着脱自在なICカード320
に、CPU316が読み取り可能なプログラムコードの
形態で記憶され、そのプログラムコードがCPU316
によって直接実行され、又は、そのプログラムコードが
必要に応じてRAM317又は書込み可能なROM31
8にロードされてCPU316によって実行されるよう
に構成されてもよい。或いは、上述の制御プログラム及
びそれに必要なデータは、無線又は有線の通信回線又は
光送受信機208(図2)から通信部111を介して他
の機器から受信されて、RAM317又は書込み可能な
ROM318にロードされてCPU316によって実行
されるように構成されてもよい。
A control program for realizing each function shown in the operation flowcharts of FIGS. 4, 5 and 8 and data necessary for the control program are, for example, ICs shown in FIG.
IC card 320 detachable from card slot 207
Is stored in the form of a program code readable by the CPU 316, and the program code is stored in the CPU 316.
Or the program code can be directly executed by the RAM 317 or the writable ROM 31 as needed.
8 to be executed by the CPU 316. Alternatively, the above-described control program and data necessary for the control program are received from another device via a communication unit 111 from a wireless or wired communication line or an optical transceiver 208 (FIG. 2), and stored in a RAM 317 or a writable ROM 318. It may be configured to be loaded and executed by the CPU 316.

【0082】まず、ステップ401→402→403→
404→401の繰返しループにおいては、図3のタッ
チパネル制御部315からタッチパネル入力の検出が通
知されたか否かの判定処理(401)、音声制御ホスト
装置108(図1)から検索結果HTML文章データが
受信されたか否かの判定処理(402)、その他の受信
/表示処理(403)、及び必要なデータの送信処理
(404)が実行される。
First, steps 401 → 402 → 403 →
In the repetition loop of 404 → 401, it is determined whether touch panel input has been detected from the touch panel control unit 315 in FIG. 3 (401), and the search result HTML text data is sent from the voice control host device 108 (FIG. 1). A determination process (402) of whether or not the data has been received, another reception / display process (403), and a necessary data transmission process (404) are executed.

【0083】タッチパネル制御部315からタッチパネ
ル入力の検出が通知されステップ401の判定がYES
となると、ステップ405又は406で、上記タッチパ
ネル入力が図3のCCDカメラ304(図2の202)
の入力指示又は図3のマイク301(図2の201)の
入力指示であるか否かが、判定される。
Touch panel control section 315 notifies of touch panel input detection, and determination in step 401 is YES.
Then, in step 405 or 406, the touch panel input is performed by the CCD camera 304 in FIG. 3 (202 in FIG. 2).
It is determined whether or not the input instruction is the input instruction of the microphone 301 of FIG. 3 (201 of FIG. 2).

【0084】タッチパネル入力が図3のCCDカメラ3
04(図2の202)の入力指示であってステップ40
5の判定がYESとなると、ステップ407で、図3の
入力部109内のカメラ制御部307に対して、例えば
手書き文字画像等の入力処理の開始が指示される。その
後、ステップ404の送信処理に進む。画像入力処理
は、本発明には特には関連しないため、その詳細な説明
は省略する。
The touch panel input is the CCD camera 3 shown in FIG.
04 (202 in FIG. 2) and the
If the determination at 5 is YES, at step 407, the camera control unit 307 in the input unit 109 in FIG. 3 is instructed to start input processing of, for example, a handwritten character image. Thereafter, the process proceeds to the transmission process of step 404. Since the image input processing is not particularly related to the present invention, a detailed description thereof will be omitted.

【0085】タッチパネル入力が図3のマイク301
(図2の201)の入力指示であってステップ406の
判定がYESとなると、ステップ408で、図3の入力
部109内のマイク制御部303に対し、音声入力処理
の開始が指示される。この音声入力処理の開始指示は、
例えばPHS通話処理の開始指示、又は文音声認識/デ
ータベース検索処理を実行するためのオフライン状態で
の音声入力処理の開始指示である。
The touch panel input is the microphone 301 shown in FIG.
If the input instruction is (201 in FIG. 2) and the determination in step 406 is YES, in step 408, the microphone control unit 303 in the input unit 109 in FIG. 3 is instructed to start the voice input process. This voice input processing start instruction is
For example, it is an instruction to start a PHS call process or an instruction to start a speech input process in an offline state for executing a sentence speech recognition / database search process.

【0086】マイク制御部303は、上述のCPU31
6からの指示によって、マイク301(図2の201)
及びA/D変換部302に対して、音声入力の開始を指
示する。この結果、A/D変換部302からは、マイク
301(図2の201)から入力された音声データが出
力される。
The microphone control unit 303 is provided with the CPU 31 described above.
6, the microphone 301 (201 in FIG. 2)
And instruct the A / D converter 302 to start voice input. As a result, the audio data input from the microphone 301 (201 in FIG. 2) is output from the A / D converter 302.

【0087】その後、上述の音声入力処理の開始指示が
PHS通話の開始指示である場合には、上述の音声デー
タは、通信制御部321の特には図示しない送信処理に
よって、所定の通話チャネルに載せられて通話相手に送
信される。
After that, when the above-mentioned voice input processing start instruction is a PHS telephone call start instruction, the above-mentioned voice data is loaded on a predetermined telephone channel by a transmission processing (not shown) of the communication control unit 321. And sent to the other party.

【0088】また、上述の音声入力処理の開始指示が文
音声認識/データベース検索処理のための音声入力処理
の開始指示を含む場合には、それ以後マイク301(図
2の201)から入力されマイク制御部303から出力
された音声データは、後述するステップ404の送信処
理において、そこで音声制御ホスト装置108に向けて
送信される。
If the above-described voice input processing start instruction includes a voice input processing start instruction for sentence voice recognition / database search processing, thereafter, the microphone 301 (201 in FIG. 2) receives the input from the microphone 301. The audio data output from the control unit 303 is transmitted to the audio control host device 108 in the transmission processing in step 404 described below.

【0089】タッチパネル入力が図3のCCDカメラ3
04(図2の202)の入力指示でも図3のマイク30
1(図2の201)の入力指示でもない場合には、ステ
ップ405及び406の判定がNOとなって、ステップ
409で、他のキー入力処理が実行される。その後、ス
テップ404の送信処理に進む。
The touch panel input is the CCD camera 3 shown in FIG.
04 (202 in FIG. 2), the microphone 30 in FIG.
If the input instruction is not the input instruction 1 (201 in FIG. 2), the determinations in steps 405 and 406 are NO, and in step 409, another key input processing is executed. Thereafter, the process proceeds to the transmission process of step 404.

【0090】一方、音声制御ホスト装置108(図1)
から通信部111を介して制御部110内のRAM31
7に検索結果HTML文章データが受信され、ステップ
401→402→403→404→401の繰返しルー
プにおけるステップ402の判定がYESとなると、ス
テップ410において、上記検索結果HTML文章デー
タがRAM317から出力部112内のメモリ313に
転送され、LCD制御部314に対して上記検索結果H
TML文章データの表示が指示される。
On the other hand, the voice control host device 108 (FIG. 1)
From the RAM 31 in the control unit 110 via the communication unit 111
7, the search result HTML text data is received, and if the determination in step 402 in the iteration loop of steps 401 → 402 → 403 → 404 → 401 becomes YES, in step 410, the search result HTML text data is output from the RAM 317 to the output unit 112. The search result H is transferred to the memory 313 in the
Display of the TML text data is instructed.

【0091】この結果、LCD制御部314の制御によ
って、メモリ313からLCDドライバ312を介して
LCD表示部311(図2の203)に、受信された検
索結果HTML文章データが表示される。
As a result, under the control of the LCD control unit 314, the received search result HTML text data is displayed on the LCD display unit 311 (203 in FIG. 2) from the memory 313 via the LCD driver 312.

【0092】次に、ステップ404の送信処理について
説明する。図5は、上記送信処理の詳細を示す動作フロ
ーチャートである。まず、ステップ501では、図4の
ステップ409の他キー入力処理によって処理されたタ
ッチパネルからのキー入力が送信指示を伴っているか否
かが判定される。この判定がNOの場合には、ステップ
505の処理へ進む。
Next, the transmission process in step 404 will be described. FIG. 5 is an operation flowchart showing details of the transmission processing. First, in step 501, it is determined whether or not a key input from the touch panel processed by the other key input processing in step 409 in FIG. 4 is accompanied by a transmission instruction. If this determination is NO, the process proceeds to step 505.

【0093】ステップ501の判定がYESの場合に
は、ステップ502で、移動端末101が現在図1の移
動端末制御ホスト装置104に接続中であるか否かが判
定される。
If the determination in step 501 is YES, in step 502, it is determined whether or not the mobile terminal 101 is currently connected to the mobile terminal control host device 104 in FIG.

【0094】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中でありステップ502の判定
がYESならば、図3の制御部110内のCPU316
は、ステップ504で、移動端末101の“端末識別コ
ード”とキー入力処理に対応するコマンドの送信指示
を、図3の通信部111内の通信制御部321に対し依
頼する。この結果、通信制御部321は、上記“端末識
別コード”とコマンドが格納されたTCP/IPパケッ
トを生成し、それをインターネット105に接続されて
いる所定のホスト(例えば図1の音声制御ホスト装置1
08)に向け送信する。
If mobile terminal 101 is currently connected to mobile terminal control host device 104 in FIG. 1 and the determination in step 502 is YES, CPU 316 in control unit 110 in FIG.
Requests the communication control unit 321 in the communication unit 111 in FIG. 3 to transmit a “terminal identification code” of the mobile terminal 101 and a command corresponding to the key input process in step 504. As a result, the communication control unit 321 generates a TCP / IP packet storing the “terminal identification code” and the command, and transmits the TCP / IP packet to a predetermined host connected to the Internet 105 (for example, the voice control host device in FIG. 1). 1
08).

【0095】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中ではなくステップ502の判
定がNOならば、図3の制御部110内のCPU316
は、ステップ503で、図3の通信部111内の通信制
御部321に対して発信処理を依頼してから、ステップ
504を実行する。
If the mobile terminal 101 is not currently connected to the mobile terminal control host device 104 in FIG. 1 and the determination in step 502 is NO, the CPU 316 in the control unit 110 in FIG.
Requests the communication control unit 321 in the communication unit 111 of FIG. 3 to perform a transmission process in step 503, and then executes step 504.

【0096】後に詳述するように、ユーザの指定に基づ
く文音声認識/データベース検索処理の開始要求コマン
ドの送信指示及び文音声認識/データベース検索処理の
終了要求コマンドの送信指示は、上述のステップ504
において発行される。
As will be described in detail later, the transmission instruction of the start request command of the sentence speech recognition / database search process and the transmission instruction of the end request command of the sentence speech recognition / database search process based on the user's designation are made in step 504 described above.
Issued at

【0097】前述したようにステップ501の判定がN
Oの場合又はステップ504の処理の後、ステップ50
5では、図4のステップ408によって、文音声認識/
データベース検索処理のための音声入力処理の開始指示
が実行されており、音声データの音声制御ホスト装置1
08(図1)への送信指示がなされているか否かが判定
される。
As described above, the determination at step 501 is N
In the case of O or after the processing of step 504, step 50
In step 5, in step 408 of FIG.
An instruction to start voice input processing for database search processing has been executed, and the voice control host device 1 for voice data has been executed.
08 (FIG. 1) is determined.

【0098】この判定がNOの場合には、ステップ51
0の処理へ進む。ステップ505の判定がYESの場合
には、ステップ506で、音声制御ホスト装置108か
ら文音声認識/データベース検索処理の開始要求コマン
ドに対する応答である送信許可データが既に返信されて
いるか否かが判定される。
If this determination is NO, step 51
Proceed to process 0. If the determination in step 505 is YES, in step 506, it is determined whether or not transmission permission data, which is a response to the command to start the sentence voice recognition / database search processing, has already been returned from the voice control host device. You.

【0099】この判定がNOの場合には、音声制御ホス
ト装置108がまだ移動端末101からの文音声認識/
データベース検索処理の開始要求コマンドに対する準備
が完了していないため、ステップ510の処理へ進む。
If the determination is NO, the voice control host device 108 still recognizes the sentence voice recognition /
Since the preparation for the database search process start request command has not been completed, the process proceeds to step 510.

【0100】音声制御ホスト装置108から文音声認識
/データベース検索処理の開始要求コマンドに対する応
答である送信許可データが既に返信されておりステップ
506の判定がYESの場合には、更に、ステップ50
7で、移動端末101が現在図1の移動端末制御ホスト
装置104に接続中であるか否かが判定される。
If transmission permission data, which is a response to the command for requesting the start of sentence voice recognition / database search processing, has already been returned from the voice control host device 108, and if the determination in step 506 is YES, then step 50 is further executed.
At 7, it is determined whether the mobile terminal 101 is currently connected to the mobile terminal control host device 104 of FIG.

【0101】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中でありステップ507の判定
がYESならば、図3の制御部110内のCPU316
は、ステップ509で、図3に示される入力部109内
のマイク制御部303から制御部110内のRAM31
7に転送されてきている音声データの送信指示を、通信
部111内の通信制御部321に対し依頼する。この結
果、通信制御部321は、上記音声データが格納された
TCP/IPパケットを生成し、それをインターネット
105に接続されている図1の音声制御ホスト装置10
8に向けて送信する。
If the mobile terminal 101 is currently connected to the mobile terminal control host device 104 in FIG. 1 and the determination in step 507 is YES, the CPU 316 in the control unit 110 in FIG.
In step 509, the microphone control unit 303 in the input unit 109 shown in FIG.
The communication control section 321 in the communication section 111 is requested to transmit the voice data transferred to the communication section 7. As a result, the communication control unit 321 generates a TCP / IP packet in which the above-mentioned voice data is stored, and transmits the TCP / IP packet to the voice control host device 10 of FIG.
Send to 8

【0102】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中ではなくステップ507の判
定がNOならば、図3の制御部110内のCPU316
は、ステップ508で、図3の通信部111内の通信制
御部321に対して発信処理を依頼してから、ステップ
509を実行する。
If mobile terminal 101 is not currently connected to mobile terminal control host device 104 in FIG. 1 and the determination in step 507 is NO, CPU 316 in control unit 110 in FIG.
Requests the communication control unit 321 in the communication unit 111 of FIG. 3 to perform a transmission process in step 508, and then executes step 509.

【0103】後に詳述するように、文音声認識/データ
ベース検索処理のための音声データの送信指示は、上述
のステップ509において発行される。前述したように
ステップ505又は506の判定がNOの場合又はステ
ップ509の処理の後、ステップ510では、図4のス
テップ407によって、画像入力処理の開始指示が実行
されており、画像データを図1のインターネット105
に接続されている特には図示しない画像制御ホスト装置
への送信指示がなされているか否かが判定される。
As will be described in detail later, an instruction to transmit voice data for sentence voice recognition / database search processing is issued in step 509 described above. As described above, when the determination in step 505 or 506 is NO or after the processing in step 509, in step 510, a start instruction of the image input processing is executed by step 407 in FIG. The Internet 105
It is determined whether or not a transmission instruction to an image control host device (not shown) connected to the image control host device is transmitted.

【0104】この判定がNOの場合には、図4のステッ
プ404の送信処理を終了する。ステップ510の判定
がYESの場合には、ステップ511で、移動端末10
1が現在図1の移動端末制御ホスト装置104に接続中
であるか否かが判定される。
If this determination is NO, the transmission processing of step 404 in FIG. 4 ends. If the determination in step 510 is YES, in step 511, the mobile terminal 10
1 is currently connected to the mobile terminal control host device 104 in FIG.

【0105】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中でありステップ511の判定
がYESならば、図3の制御部110内のCPU316
は、ステップ513で、図3に示される入力部109内
のメモリ306に得られている画像データの送信指示
を、通信部111内の通信制御部321に対して依頼す
る。この結果、通信制御部321は、上記画像データが
格納されたTCP/IPパケットを生成し、それをイン
ターネット105に接続されている特には図示しない画
像制御ホスト装置108に向けて送信する。
If mobile terminal 101 is currently connected to mobile terminal control host device 104 in FIG. 1 and the determination in step 511 is YES, CPU 316 in control unit 110 in FIG.
Requests the communication control unit 321 in the communication unit 111 to transmit the image data obtained in the memory 306 in the input unit 109 shown in FIG. As a result, the communication control unit 321 generates a TCP / IP packet storing the image data, and transmits the TCP / IP packet to the image control host device 108 (not shown) connected to the Internet 105.

【0106】移動端末101が現在図1の移動端末制御
ホスト装置104に接続中ではなくステップ511の判
定がNOならば、図3の制御部110内のCPU316
は、ステップ512で、図3の通信部111内の通信制
御部321に対して発信処理を依頼してから、ステップ
513を実行する。
If mobile terminal 101 is not currently connected to mobile terminal control host device 104 in FIG. 1 and the determination in step 511 is NO, CPU 316 in control unit 110 in FIG.
Requests the communication control unit 321 in the communication unit 111 of FIG. 3 to perform a transmission process in step 512, and then executes step 513.

【0107】なお、ステップ513の画像データの送信
指示は、本発明には特には関連しないため、その詳細な
説明は省略する。前述したようにステップ510の判定
がNOの場合又はステップ513の処理の後、図4のス
テップ404の送信処理を終了する。 <通信データのフォーマット>図6は、移動端末101
と移動端末制御ホスト装置104及びインターネット1
05(音声制御ホスト装置108)との間で通信される
通信データのフォーマット図である。
Since the image data transmission instruction in step 513 is not particularly related to the present invention, a detailed description thereof will be omitted. As described above, when the determination in step 510 is NO or after the processing in step 513, the transmission processing in step 404 in FIG. 4 ends. <Format of Communication Data> FIG.
And mobile terminal control host device 104 and Internet 1
FIG. 5 is a format diagram of communication data communicated with the MFP 05 (voice control host device 108).

【0108】移動端末101と移動端末制御ホスト装置
104との間では、通信データは、PPP(Point-to-P
oint Protocol )と呼ばれる通信プロトコルに基づき、
図6(a) に示されるPPPフレーム(図の左から右に向
けて転送される)を用いて、PHS規格の32kbit
s/secの伝送レートを有するデジタル通信チャネル
上を伝送される。
Communication data between the mobile terminal 101 and the mobile terminal control host device 104 is PPP (Point-to-P
oint Protocol).
Using the PPP frame shown in FIG. 6A (transferred from left to right in the figure), 32 kbits of the PHS standard
It is transmitted over a digital communication channel having a transmission rate of s / sec.

【0109】PPPフレームを構成する、“フラグ”、
“アドレス”、“コントロール”の各フィールドは、図
6(a) に示される各固定ビット列が設定される。2オク
テットのデータ長を有するFCSは、フレームチェック
シーケンスと呼ばれ、PPPフレームデータの誤り検出
/訂正用のデータである。移動端末101と移動端末制
御ホスト装置104との間でPPPリンクが確立した後
に転送されるPPPフレームの“インフォメーション”
フィールド(可変データ長を有する)には、インターネ
ット105(図1)上のデータの基本伝送単位であるI
Pデータグラムが格納され、その場合に、2オクテット
のデータ長を有する“プロトコル”フィールドには、”
インフォメーション”フィールドにIPデータグラムが
格納されていることを示す16進値“0021”が格納され
る。
"Flag", which constitutes a PPP frame,
In each of the "address" and "control" fields, each fixed bit string shown in FIG. 6A is set. The FCS having a data length of 2 octets is called a frame check sequence, and is data for error detection / correction of PPP frame data. “Information” of a PPP frame transferred after a PPP link is established between the mobile terminal 101 and the mobile terminal control host device 104
The field (having a variable data length) includes I, which is a basic transmission unit of data on the Internet 105 (FIG. 1).
P datagram is stored, in which case a "protocol" field having a data length of 2 octets contains:
A hexadecimal value “0021” indicating that the IP datagram is stored is stored in the “information” field.

【0110】PPPフレームの“インフォメーション”
フィールドには、上述のようにIPデータグラムが格納
される。このIPデータグラムは、上述のようにインタ
ーネット105上のデータの基本伝送単位である。IP
データグラムは、インターネットプロトコル(IP)に
従って規定され、その“データ”フィールドに格納され
たデータをインターネット105上の宛先のホスト装置
まで一意に転送するための機能を提供し、インターネッ
ト105上でのアドレスを特定する機能、そのIPデー
タグラム自身を“宛先IPアドレス”で指定されたホス
トまでインターネット105上の一定の経路で転送する
機能、そのIPデータグラム自身のフラグメント化(分
割)と再組立てを行う機能等を備える。
"Information" of PPP frame
The IP datagram is stored in the field as described above. This IP datagram is a basic transmission unit of data on the Internet 105 as described above. IP
The datagram is defined in accordance with the Internet Protocol (IP), provides a function for uniquely transferring data stored in its “data” field to a destination host device on the Internet 105, and has an address on the Internet 105. , The function of transferring the IP datagram itself to the host specified by the "destination IP address" through a fixed route on the Internet 105, and the fragmentation (division) and reassembly of the IP datagram itself. It has functions and the like.

【0111】IPデータグラムは、図6(b) に示される
ように、IPヘッダフィールドとデータフィールドとか
ら構成される。IPヘッダフィールドには、それが含ま
れるIPデータグラム自身を配送するために必要な全て
の情報が含まれる。図7(a)は、IPヘッダのフォーマ
ット図である。
An IP datagram is composed of an IP header field and a data field as shown in FIG. The IP header field contains all the information necessary to deliver the IP datagram containing it. FIG. 7A is a format diagram of the IP header.

【0112】IPヘッダは、32ビットを1ワードとし
て、5乃至6ワードのデータ長を有し、このデータ長は
第1ワードの“ヘッダ長”フィールドに格納され、ま
た、IPデータグラム全体のデータ長は、第1ワードの
“IPデータグラムの全長”フィールドに格納される。
The IP header has a data length of 5 to 6 words, with 32 bits as one word. This data length is stored in the “header length” field of the first word. The length is stored in the first word of the "total length of IP datagram" field.

【0113】第1ワードの“バージョン”フィールドに
は、IPデータグラムの転送方法を規定するインターネ
ットプロトコル(IP)のバージョンが設定され、現在
のバージョンは4である。
In the "version" field of the first word, the version of the Internet Protocol (IP) that defines the method of transmitting the IP datagram is set. The current version is 4.

【0114】第1ワードの“サービスの種類”フィール
ドには、配送の優先度を表わす情報等が格納されるが、
ここは本発明には特には関連しない。第2ワードの各フ
ィールドは、IPデータグラムがインターネット105
上での転送の制約によりフラグメント化(分割)される
場合における制御情報を規定する。まず、“識別番号”
フィールドには、分割されたフラグメントであるこのI
Pデータグラムが属する分割前のIPデータグラムを識
別するための一意な整数が設定される。次に、”フラグ
メントのオフセット”フィールドには、分割されたフラ
グメントであるこのIPデータグラムが分割前のIPデ
ータグラムのどの部分に相当するかを示すオフセット情
報が設定される。そして、”フラグ列”フィールドに
は、分割されたフラグメントであるこのIPデータグラ
ムに、それが属する分割前のIPデータグラムを構成す
る他のフラグメントが後続するか否かが設定される。以
上の情報により、インターネット105上の中継ホスト
においてIPデータグラムがフラグメント化されても、
受信側で分割前のIPデータグラムを正確に復元するこ
とができる。
In the “service type” field of the first word, information indicating the priority of delivery is stored.
This is not particularly relevant to the present invention. Each field of the second word indicates that the IP datagram is
The control information in the case of fragmentation (division) due to the above-described transfer restriction is defined. First, the “identification number”
The field contains this fragmented I
A unique integer for identifying the undivided IP datagram to which the P datagram belongs is set. Next, in the “fragment offset” field, offset information indicating which part of the IP datagram before the division corresponds to the IP datagram that is the divided fragment is set. In the "flag string" field, it is set whether or not another fragment constituting the undivided IP datagram to which this divided IP datagram belongs is followed by the divided fragment. With the above information, even if the IP datagram is fragmented at the relay host on the Internet 105,
The IP datagram before division can be accurately restored on the receiving side.

【0115】第3ワードの“生存期間”(TTL:Time
To Live)フィールドには、そのIPデータグラムがイ
ンターネット105上にどれだけの時間の間存在するこ
とを許すかを示す秒単位の時間情報が設定される。イン
ターネット105上の中継ホストは、IPデータグラム
を処理する毎に上記フィールド値を減算し、値が0以下
になったIPデータグラムはインターネット105上か
ら廃棄する。これにより、インターネット105上での
過度なトラヒックの発生が抑制される。なお、廃棄され
たIPデータグラムに関する再送制御は、そのIPデー
タグラムに格納されるTCPセグメントに対する制御処
理において実行される。
The "lifetime" of the third word (TTL: Time
In the “To Live” field, time information in seconds indicating how long the IP datagram is allowed to exist on the Internet 105 is set. The relay host on the Internet 105 subtracts the above field value each time the IP datagram is processed, and discards the IP datagram whose value becomes 0 or less from the Internet 105. This suppresses the occurrence of excessive traffic on the Internet 105. The retransmission control for the discarded IP datagram is executed in a control process for a TCP segment stored in the IP datagram.

【0116】第3ワードの“プロトコル”フィールドに
は、そのIPデータグラムの“データ”フィールドに格
納されるデータのフォーマットを規定するための整数値
が設定される。本実施の形態の場合には、図6(c) に示
されるように、IPデータグラムの“データ”フィール
ドにはTCPセグメントデータが格納されるため、その
フォーマットを規定する整数値6が設定される。
In the "protocol" field of the third word, an integer value for defining the format of data stored in the "data" field of the IP datagram is set. In the case of the present embodiment, as shown in FIG. 6C, since the TCP segment data is stored in the "data" field of the IP datagram, an integer value 6 defining the format is set. You.

【0117】第3ワードの“ヘッダのチェックサム”フ
ィールドには、IPヘッダのデータの誤りを検出するた
めのチェックサムデータが設定される。第4ワードに
は、32ビットの“送信元IPアドレス”が設定され
る。例えばIPデータグラムが移動端末101から音声
制御ホスト装置108へ転送される場合には、“送信元
IPアドレス”としては、後述する発信処理により移動
端末制御ホスト装置104から移動端末101に対して
付与されたIPアドレスが設定される。図1の音声制御
ホスト装置108は、この“送信元IPアドレス”を記
憶することにより、インターネット105を介して移動
端末101に対して、フォーマット文章データ等を返信
することができる。
In the “checksum of header” field of the third word, checksum data for detecting an error in the data of the IP header is set. A 32-bit “source IP address” is set in the fourth word. For example, when an IP datagram is transferred from the mobile terminal 101 to the voice control host device 108, the “source IP address” is assigned from the mobile terminal control host device 104 to the mobile terminal 101 by a transmission process described later. The set IP address is set. By storing this “source IP address”, the voice control host device 108 in FIG. 1 can return format text data and the like to the mobile terminal 101 via the Internet 105.

【0118】第5ワードには、32ビットの“宛先IP
アドレス”が設定される。例えばIPデータグラムが移
動端末101から音声制御ホスト装置108へ転送され
る場合には、“宛先IPアドレス”としては、音声制御
ホスト装置108に固定的に割当てられているIPアド
レスが設定される。移動端末制御ホスト装置104内の
ルーティング部114、インターネット105上の各中
継ホスト装置、及び音声サービスプロバイダ内のルータ
装置106は、受信したIPデータグラムに格納されて
いる上記“宛先IPアドレス”を識別することによっ
て、予め各装置が有する経路制御テーブル情報に従っ
て、そのIPデータグラムの配送経路を決定し、最終的
にそのIPデータグラムを音声サービスプロバイダ内の
音声制御ホスト装置108まで転送することができる。
The fifth word contains a 32-bit “destination IP”.
For example, when an IP datagram is transferred from the mobile terminal 101 to the voice control host device 108, the “destination IP address” is fixedly assigned to the voice control host device 108. The IP address is set.The routing unit 114 in the mobile terminal control host device 104, each relay host device on the Internet 105, and the router device 106 in the voice service provider are stored in the received IP datagram. By identifying the "destination IP address", the delivery route of the IP datagram is determined in advance according to the routing control table information of each device, and finally the IP datagram is transferred to the voice control host device in the voice service provider. 108.

【0119】第6ワードの“IPオプション”フィール
ドは、オプションであり、インターネット105を構成
する各ネットワークのテスト又はデバッグのための情報
や、インターネット105上での配送経路を制御又は監
視するための制御情報等が設定されるが、ここは本発明
には特には関連しない。
The “IP option” field of the sixth word is optional, and is used for information for testing or debugging each network constituting the Internet 105 and control for controlling or monitoring a delivery route on the Internet 105. Information and the like are set, but this is not particularly relevant to the present invention.

【0120】第6ワードの“パディング”フィールドに
は、データ長を合わせるためのパディングデータが設定
される。次に、IPデータグラムの“データ”フィール
ドには、TCPセグメントデータが格納される。このT
CPセグメントは、トランスミッションコントロールプ
ロトコル(TCP)に従って規定され、その“データ”
フィールドに格納されたデータをインターネット105
上の宛先のホスト装置まで正確に適切な順序で配送する
ための機能を備える。IPデータグラムがインターネッ
ト105上でのデータの一意な転送の機能のみを提供
し、データの信頼性を確保する機能(再送制御機能等)
を提供しないのに対して、TCPセグメントは、データ
の信頼性を確保する機能を提供するものである。
In the "padding" field of the sixth word, padding data for adjusting the data length is set. Next, TCP segment data is stored in the "data" field of the IP datagram. This T
The CP segment is defined according to the Transmission Control Protocol (TCP), and its "data"
The data stored in the field is transferred to the Internet 105
A function is provided for accurately delivering the packet to the above destination host device in an appropriate order. IP datagrams provide only the unique transfer function of data on the Internet 105, and the function of ensuring data reliability (retransmission control function, etc.)
Is provided, whereas the TCP segment provides a function for ensuring data reliability.

【0121】このように、通信データが、(PPPフレ
ームと)IPデータグラムとTCPセグメントという階
層構造を有するのは、インターネット105上ではなる
べく小さい処理負荷のもとで効率良くデータを配送する
必要があり、エンド対エンド間ではできるかぎり信頼性
の高いデータ配送を実現する必要があるという異なる要
請に効率的に対処するためである。これにより、インタ
ーネット105上の中継ホスト装置は、IPデータグラ
ムのIPヘッダのみを参照することにより、そのIPデ
ータグラムの“データ”フィールドに格納された情報
(TCPセグメント)をできる限り高速かつ効率的に宛
先ホスト装置まで配送することができ、エンド対エンド
(送信元ホスト装置と宛先ホスト装置)間では、TCP
セグメントのTCPヘッダを参照することにより、再送
制御等の信頼性の高いデータ通信を実現することができ
るのである。
As described above, the communication data has the hierarchical structure of the IP datagram (with the PPP frame) and the TCP segment. Therefore, it is necessary to efficiently deliver the data on the Internet 105 under a processing load as small as possible. Yes, in order to efficiently address the different demands of achieving the most reliable data delivery end-to-end. As a result, the relay host device on the Internet 105 refers to only the IP header of the IP datagram, so that the information (TCP segment) stored in the “data” field of the IP datagram is as fast and efficiently as possible. To the destination host device, and between end-to-end (source host device and destination host device), TCP
By referring to the TCP header of the segment, highly reliable data communication such as retransmission control can be realized.

【0122】TCPセグメントは、図6(b) に示される
ように、TCPヘッダフィールドとデータフィールドと
から構成される。図7(b) は、TCPヘッダのフォーマ
ット図である。
The TCP segment is composed of a TCP header field and a data field as shown in FIG. FIG. 7B is a format diagram of the TCP header.

【0123】TCPヘッダは、IPヘッダの場合と同様
に、32ビットを1ワードとして、5乃至6ワードのデ
ータ長を有し、このデータ長は第4ワードの“ヘッダ
長”フィールドに格納され、また、IPデータグラム全
体のデータ長は、第1ワードの“IPデータグラムの全
長”フィールドに格納される。
As in the case of the IP header, the TCP header has a data length of 5 to 6 words with 32 bits as one word, and this data length is stored in the “header length” field of the fourth word. Also, the data length of the entire IP datagram is stored in the “total length of IP datagram” field of the first word.

【0124】第1ワードの“送信元ポート番号”フィー
ルド及び“宛先ポート番号”フィールドには、文音声認
識/データベース検索処理のための通信プロトコルを特
定する16ビットの整数値が設定される。
In the "source port number" field and the "destination port number" field of the first word, a 16-bit integer value specifying a communication protocol for sentence speech recognition / database search processing is set.

【0125】音声制御ホスト装置108内のパケット送
受信部115(図1)は、文音声認識/データベース検
索処理のための音声データが格納されたTCPセグメン
トのほかにも、電子メールデータを始めとする様々なデ
ータが格納された様々なTCPセグメントを送受信する
ため、受信したTCPセグメントのTCPヘッダに設定
されている“宛先ポート番号”フィールドの値を認識す
ることによって、そのTCPセグメントの“データ”フ
ィールドに格納されているデータを音声制御ホスト装置
108で実行されるどのアプリケーションに引き渡すか
を決定することができる。
The packet transmission / reception unit 115 (FIG. 1) in the voice control host device 108 includes electronic mail data in addition to TCP segments in which voice data for sentence voice recognition / database search processing is stored. In order to transmit and receive various TCP segments storing various data, by recognizing the value of the “destination port number” field set in the TCP header of the received TCP segment, the “data” field of the TCP segment is recognized. Can be determined to which application executed on the voice control host device 108 the data stored in the voice control host device 108 is to be delivered.

【0126】そして、パケット送受信部115は、受信
したTCPセグメントのTCPヘッダに設定されている
“宛先ポート番号”フィールドの値が文音声認識/デー
タベース検索処理のための通信プロトコルに対応する値
を示している場合には、そのTCPセグメントの“デー
タ”フィールドに格納されている音声データを移動端末
通信制御部116に引き渡すことができる。
The packet transmitting / receiving unit 115 sets the value of the “destination port number” field set in the TCP header of the received TCP segment to a value corresponding to the communication protocol for sentence speech recognition / database search processing. In this case, the voice data stored in the "data" field of the TCP segment can be delivered to the mobile terminal communication control unit 116.

【0127】同様に、移動端末101の通信部111内
の通信制御部321(図3)も、検索結果HTML文章
データが格納されたTCPセグメントの他にも、ホーム
ページデータや電子メールデータを始めとする様々なデ
ータが格納された様々なTCPセグメントを送受信する
ため、受信したTCPセグメントのTCPヘッダに設定
されている“宛先ポート番号”フィールドの値を認識す
ることにより、そのTCPセグメントの“データ”フィ
ールドに格納されているデータを移動端末101で実行
されるどのアプリケーションに引き渡すかを決定するこ
とができる。
Similarly, the communication control unit 321 (FIG. 3) in the communication unit 111 of the mobile terminal 101 also stores homepage data and e-mail data in addition to the TCP segment in which the search result HTML text data is stored. In order to transmit and receive various TCP segments storing various data to be transmitted and received, the value of the “destination port number” field set in the TCP header of the received TCP segment is recognized, so that the “data” of the TCP segment is recognized. It is possible to determine to which application executed on the mobile terminal 101 the data stored in the field is to be delivered.

【0128】そして、通信制御部321は、受信したT
CPセグメントのTCPヘッダに設定されている“宛先
ポート番号”フィールドの値が文音声認識/データベー
ス検索処理のための通信プロトコルに対応する値を示し
ている場合には、制御部110(図1、図3)に、文音
声認識/データベース検索処理のためのデータの受信を
通知し、そのTCPセグメントの“データ”フィールド
に格納されている検索結果HTML文章データを引き渡
すことができる。
The communication control unit 321 transmits the received T
If the value of the “destination port number” field set in the TCP header of the CP segment indicates a value corresponding to a communication protocol for sentence speech recognition / database search processing, the control unit 110 (FIG. 1, FIG. 3), the reception of data for sentence speech recognition / database search processing is notified, and the search result HTML text data stored in the “data” field of the TCP segment can be delivered.

【0129】更に、音声制御ホスト装置108内のパケ
ット送受信部115及び移動端末101の通信部111
内の通信制御部321は、受信したTCPセグメントの
TCPヘッダに設定されている“送信元ポート番号”を
確認することにより、送信元のアプリケーションを確認
することができる。
Furthermore, the packet transmission / reception unit 115 in the voice control host device 108 and the communication unit 111 of the mobile terminal 101
The communication control unit 321 in the above can confirm the source application by confirming the “source port number” set in the TCP header of the received TCP segment.

【0130】次に、図7に示されるTCPヘッダの第2
ワードの“シーケンス番号”フィールドは、現在のTC
Pコネクションにおいて送信側から受信側に送信される
全バイトストリームのうち、このTCPセグメントの
“データ”フィールドに格納されているデータの先頭が
上記全バイトストリームの何バイト目にあたるかを、送
信側から受信側に通知するためのフィールドである。逆
に、第3ワードの“確認応答番号”フィールドは、現在
のTCPコネクションにおいて送信側から受信側に送信
される全バイトストリームのうち、受信側が現在何バイ
ト目までを誤り無く受信したかを、受信側から送信側に
通知するためのフィールドである。これにより、例えば
移動端末101から音声制御ホスト装置108に対し
て、音声データを正しい順序でかつ高い信頼性のもとで
転送することが可能となる。
Next, the second TCP header shown in FIG.
The word "sequence number" field contains the current TC
From the entire byte stream transmitted from the transmission side to the reception side in the P connection, the transmission side determines from which byte of the byte stream the data stored in the "data" field of this TCP segment corresponds. This is a field for notifying the receiving side. Conversely, the “acknowledgement number” field of the third word indicates the number of bytes that the receiving side has received without error in the entire byte stream transmitted from the transmitting side to the receiving side in the current TCP connection. This is a field for notification from the receiving side to the transmitting side. As a result, for example, the voice data can be transferred from the mobile terminal 101 to the voice control host device 108 in the correct order and with high reliability.

【0131】第4ワードの“フラグ列”フィールドに
は、TCPセグメントの種類を示す値が設定される。T
CP通信においては、例えばコネクションの開始時又は
終了時等において確認応答のための様々な制御データが
通信されるが、それらの制御データの種類が、“フラグ
列”フィールドに設定される。
In the "flag string" field of the fourth word, a value indicating the type of the TCP segment is set. T
In the CP communication, for example, various control data for acknowledgment is transmitted at the start or end of the connection, for example, and the type of the control data is set in the “flag string” field.

【0132】第4ワードの“ウインドウ”フィールド
は、受信側が現在何バイトのデータを連続して受信する
ことが可能であるかを示すウインドウデータを、受信側
から送信側に通知するためのフィールドである。これに
より、受信側から送信側に対するデータのフロー制御が
可能となり、例えば音声制御ホスト装置108の負荷が
高いような場合には移動端末101に対して音声データ
の送信を抑制させる、といようなきめの細かい制御が可
能となる。
The "window" field of the fourth word is a field for notifying the receiving side to the transmitting side window data indicating how many bytes of data the receiving side can currently receive continuously. is there. This enables data flow control from the receiving side to the transmitting side. For example, when the load on the voice control host device 108 is high, the transmission of voice data to the mobile terminal 101 is suppressed. Fine control is possible.

【0133】第4ワードの“予約済”フィールドは、予
約用のフィールドである。第5ワードの“チェックサ
ム”フィールドには、TCPヘッダ及び“データ”フィ
ールドに格納されているデータの誤りを検出するための
チェックサムデータが格納される。これにより、例えば
音声制御ホスト装置108は、移動端末101から音声
データを正確に受信することができる。
The “reserved” field of the fourth word is a field for reservation. The “checksum” field of the fifth word stores checksum data for detecting an error in the data stored in the TCP header and the “data” field. Thus, for example, the voice control host device 108 can correctly receive voice data from the mobile terminal 101.

【0134】第5ワードの“緊急ポインタ”は、緊急デ
ータ(インタラプトデータやアボートデータ等)を通信
するための制御データであるが、これは本発明には特に
は関連しない。
The "urgent pointer" of the fifth word is control data for communicating urgent data (interrupt data, abort data, etc.), but this is not particularly relevant to the present invention.

【0135】第6ワードの“オプション”フィールド
は、例えば送受信装置間で通信可能な最大セグメント長
を指定するため等に使用されるが、これは本発明には特
には関連しない。
The "option" field of the sixth word is used, for example, to specify the maximum segment length that can be communicated between the transmitting and receiving apparatuses, but this is not particularly relevant to the present invention.

【0136】第6ワードの“パディング”フィールドに
は、データ長を合わせるためのパディングデータが設定
される。上述の構成を有するTCPセグメントの通信
(終端)処理機能は、移動端末101においては通信部
111内の通信制御部321(図3)において実現さ
れ、音声制御ホスト装置108においてはパケット送受
信部115(図1)において実現される。なお、移動端
末101においてCPU316が実行する制御プログラ
ムが上記処理機能を実現するように構成されてもよい。 <発信処理>前述のように、移動端末101の制御部1
10内のCPU316(図3)は、図4のステップ40
4に対応する図5に示される送信処理のうち、移動端末
101が現在図1の移動端末制御ホスト装置104に接
続中でなくステップ502、507、又は511の判定
がNOである場合には、ステップ503、508、又は
512において、図3の通信部111内の通信制御部3
21に対して発信処理を依頼する。この依頼によって、
通信制御部321が実行する発信処理は、図8の動作フ
ローチャートによって示される。
In the “padding” field of the sixth word, padding data for adjusting the data length is set. The communication (termination) processing function of the TCP segment having the above-described configuration is realized by the communication control unit 321 (FIG. 3) in the communication unit 111 in the mobile terminal 101, and the packet transmission / reception unit 115 ( 1). Note that the control program executed by the CPU 316 in the mobile terminal 101 may be configured to realize the above processing functions. <Outgoing Call Processing> As described above, the control unit 1 of the mobile terminal 101
The CPU 316 in FIG. 10 (FIG. 3)
5, when the mobile terminal 101 is not currently connected to the mobile terminal control host device 104 in FIG. 1 and the determination in step 502, 507, or 511 is NO, In step 503, 508, or 512, the communication control unit 3 in the communication unit 111 in FIG.
Request the transmission processing to 21. By this request,
The transmission process executed by the communication control unit 321 is shown by the operation flowchart in FIG.

【0137】まず、ステップ801では、リンク確立フ
ェーズが実行される。このフェーズでは、移動端末制御
ホスト装置104のアクセス電話番号に対して自動的に
ダイヤルアップが行われ移動端末制御ホスト装置104
が着信した後、リンクコントロールプロトコル(LC
P)と呼ばれるプロトコルを使用し、通信に使用される
PPPフレーム(図6(a) )の最大データ長の決定、エ
スケープされるべき非透過文字の決定、PPPフレーム
の“プロトコル”フィールド(図6(a) )のデータ長を
2オクテットから1オクテットに圧縮することの有無の
決定、PPPフレームの固定値“11111111”を有する
“アドレス”フィールド(図6(a) )を省略(圧縮)す
ることの有無の決定等に関するネゴシエーションが、移
動端末制御ホスト装置104内の接続確立部113(図
1)との間で実行される。この場合、移動端末101の
通信部111内の通信制御部321と移動端末制御ホス
ト装置104内の接続確立部113との間の通信は、図
6(a) に示されるフォーマットを有するPPPフレーム
を用いて、その“プロトコル”フィールドにLCPを特
定する16進値“c021”を設定し、その“インフォメー
ションフィールド”に、必要な制御データを設定して、
実行される。
First, in step 801, a link establishment phase is executed. In this phase, the access telephone number of the mobile terminal control host device 104 is automatically dialed up and the mobile terminal control host device 104
Is received, the link control protocol (LC
P), a maximum data length of a PPP frame (FIG. 6A) used for communication, a non-transparent character to be escaped, a "protocol" field of the PPP frame (FIG. 6). (a)) Determine whether to compress the data length from 2 octets to 1 octet, and omit (compress) the "address" field (FIG. 6 (a)) having the fixed value "11111111" of the PPP frame. A negotiation regarding the determination of the presence / absence is performed with the connection establishment unit 113 (FIG. 1) in the mobile terminal control host device 104. In this case, communication between the communication control unit 321 in the communication unit 111 of the mobile terminal 101 and the connection establishment unit 113 in the mobile terminal control host device 104 is performed by using a PPP frame having the format shown in FIG. By setting a hexadecimal value “c021” specifying the LCP in the “protocol” field and setting necessary control data in the “information field”,
Be executed.

【0138】次に、ステップ802においては、認証フ
ェーズが実行される。このフェーズでは、PAP(Pass
word Authentication Protocol)又はCHAP(Challe
ngeHandshake Authentication Protocol )と呼ばれる
認証プロトコルを使用し、移動端末101を使用するユ
ーザの認証が、移動端末制御ホスト装置104内の接続
確立部113(図1)から移動端末101に対して実行
される。これにより、移動端末制御ホスト装置104を
運営するインターネットプロバイダは、移動端末101
を使用するユーザが契約されたユーザであるか否かを決
定できる。この場合、移動端末101の通信部111内
の通信制御部321と移動端末制御ホスト装置104内
の接続確立部113との間の通信は、図6(a) に示され
るフォーマットを有するPPPフレームを用いて、その
“プロトコル”フィールドにPAPを特定する16進値
“c023”又はCHAPを特定する16進値“c223”を設
定し、その“インフォメーションフィールド”に、必要
な認証用データを設定して、実行される。
Next, in step 802, an authentication phase is executed. In this phase, PAP (Pass
word Authentication Protocol) or CHAP (Challe
The authentication of the user using the mobile terminal 101 is performed from the connection establishment unit 113 (FIG. 1) in the mobile terminal control host device 104 to the mobile terminal 101 using an authentication protocol called ngeHandshake Authentication Protocol). As a result, the Internet provider operating the mobile terminal control host device 104 becomes the mobile terminal 101
Can be determined whether or not the user who uses is a contracted user. In this case, communication between the communication control unit 321 in the communication unit 111 of the mobile terminal 101 and the connection establishment unit 113 in the mobile terminal control host device 104 is performed by using a PPP frame having the format shown in FIG. A hexadecimal value “c023” specifying PAP or a hexadecimal value “c223” specifying CHAP is set in the “protocol” field, and necessary authentication data is set in the “information field”. Will be executed.

【0139】最後に、ステップ803では、ネットワー
クレイヤプロトコルフェーズが実行される。本実施の形
態の場合、このフェーズでは、IPコントロールプロト
コル(IPCP)と呼ばれるプロトコルを使用して、T
CPヘッダ(図7(b) 参照)の圧縮の有無が決定される
と共に、移動端末制御ホスト装置104が割当てること
のできる空き(未使用)IPアドレスのうちの1つが移
動端末101に対して割り当てられ、加えて、必要な経
路情報が移動端末101の通信部111内の通信制御部
321(図3)と移動端末制御ホスト装置104内のル
ーティング部114(図1)に設定される。これ以後、
移動端末101は、そのIPアドレスを使用することに
よって、インターネット105に接続される音声制御ホ
スト装置108、及びインターネット105上のユーザ
が希望する任意のリソースにアクセスすることが可能と
なる。この場合、移動端末101の通信部111内の通
信制御部321と移動端末制御ホスト装置104内の接
続確立部113との間の通信は、図6(a) に示されるフ
ォーマットを有するPPPフレームを用いて、その“プ
ロトコル”フィールドにIPCPを特定する16進値
“8021”を設定し、その“インフォメーションフィール
ド”に、必要なIPアドレスのネゴシエーションのため
のデータ等を設定して、実行される。
Finally, in step 803, a network layer protocol phase is executed. In the case of the present embodiment, in this phase, a protocol called an IP control protocol (IPCP) is used, and T
Whether to compress the CP header (see FIG. 7B) is determined, and one of the free (unused) IP addresses that can be allocated by the mobile terminal control host device 104 is allocated to the mobile terminal 101. In addition, necessary route information is set in the communication control unit 321 (FIG. 3) in the communication unit 111 of the mobile terminal 101 and the routing unit 114 (FIG. 1) in the mobile terminal control host device 104. After this,
By using the IP address, the mobile terminal 101 can access the voice control host device 108 connected to the Internet 105 and any resource desired by the user on the Internet 105. In this case, communication between the communication control unit 321 in the communication unit 111 of the mobile terminal 101 and the connection establishment unit 113 in the mobile terminal control host device 104 is performed by using a PPP frame having the format shown in FIG. The "protocol" field is used to set a hexadecimal value "8021" for specifying the IPCP, and the "information field" is set with data for negotiating a necessary IP address, and executed.

【0140】以上の一連の動作により、移動端末101
は、移動端末制御ホスト装置104内のルーティング部
114との間で通信用のTCP/IPパケットが格納さ
れたPPPフレームを授受することが可能となり、移動
端末101は、インターネット105上のリソースに自
由にアクセスすることが可能になる。
By the above series of operations, the mobile terminal 101
Can exchange a PPP frame storing a TCP / IP packet for communication with the routing unit 114 in the mobile terminal control host device 104, and the mobile terminal 101 can freely use resources on the Internet 105. Can be accessed.

【0141】なお、PHS通話時にも音声制御ホスト装
置108等へのアクセスを可能とするために、移動端末
101は、例えば2チャネル同時通信機能を有するよう
に構成することができる。
Note that the mobile terminal 101 can be configured to have, for example, a two-channel simultaneous communication function in order to allow access to the voice control host device 108 and the like even during a PHS call.

【0142】また、移動端末101の通信部111内の
通信制御部321(図3)は、一定時間(例えば10分
間)送受信データを検出しなかった場合に、移動端末制
御ホスト装置104との間のPPPリンクを自動的に切
断するように構成することができる。 <文音声認識/データベース検索処理に関する移動端末
101の送受信処理の詳細動作>ユーザが移動端末10
1のタッチパネルを操作して文音声認識/データベース
検索処理の開始を指示した場合及びそれ以後に移動端末
101が実行する送受信処理の詳細な動作について、説
明する。
When the communication control unit 321 (FIG. 3) in the communication unit 111 of the mobile terminal 101 does not detect transmission / reception data for a predetermined time (for example, 10 minutes), the communication control unit 321 communicates with the mobile terminal control host device 104. May be configured to automatically disconnect the PPP link. <Detailed operation of transmission / reception processing of mobile terminal 101 related to sentence speech recognition / database search processing>
The detailed operation of the transmission / reception processing executed by the mobile terminal 101 when the start of sentence speech recognition / database search processing is instructed by operating the touch panel 1 and thereafter will be described.

【0143】上述のタッチパネルの操作は、図3のタッ
チパネル制御部315において検出された後、制御部1
10内のCPU316(図3)によって、それが実行さ
れる前述した図4の動作フローチャートに対応する制御
動作において、ステップ401の判定がYES、ステッ
プ405及び406の判定がNOとなって、ステップ4
09の他キー入力処理が実行されることにより、検出さ
れる。更に、ステップ404の送信処理において、前述
した図5のステップ501の判定がYESとなり、必要
に応じてステップ503で発信処理が実行された後、ス
テップ504において、移動端末101の“端末識別コ
ード”と上述の文音声認識/データベース検索処理の開
始指示を示すキー入力処理に対応するコマンドの送信指
示が、図3の通信部111内の通信制御部321に対し
て依頼される。
The operation of the touch panel described above is detected by the touch panel control unit 315 of FIG.
In the control operation corresponding to the above-described operation flowchart of FIG. 4 executed by the CPU 316 (FIG. 3) in the CPU 10, the determination in step 401 is YES, and the determinations in steps 405 and 406 are NO.
09 is detected by executing another key input process. Further, in the transmission processing in step 404, the determination in step 501 in FIG. 5 described above is YES, and the transmission processing is executed in step 503 as necessary. Then, in step 504, the “terminal identification code” of the mobile terminal 101 is transmitted. Then, the communication control unit 321 in the communication unit 111 of FIG. 3 is requested to send a command corresponding to the key input process indicating the start instruction of the sentence speech recognition / database search process.

【0144】この結果、通信制御部321は、まず、図
6(c) に示されるフォーマットを有するTCPセグメン
トを生成する。この場合、図6(c) 及び図7(b) に示さ
れるフォーマットを有するTCPヘッダにおいて、“送
信元ポート番号”フィールド及び“宛先ポート番号”フ
ィールドには、文音声認識/データベース検索処理のた
めの通信プロトコルを特定する16ビットの整数値が設
定される。そして、TCPセグメントの“データ”フィ
ールドには、移動端末101を特定する“端末識別コー
ド”(例えばそのPHS電話番号)と、ユーザの指定に
基づく文音声認識/データベース検索処理の開始要求コ
マンドとが格納される。
As a result, the communication control section 321 first generates a TCP segment having the format shown in FIG. In this case, in the TCP header having the format shown in FIGS. 6 (c) and 7 (b), the "source port number" field and the "destination port number" field contain text / speech recognition / database search processing. A 16-bit integer value specifying the communication protocol is set. In the “data” field of the TCP segment, a “terminal identification code” (for example, the PHS telephone number) for identifying the mobile terminal 101 and a command for starting a sentence voice recognition / database search process based on a user's designation are included. Is stored.

【0145】次に、通信制御部321は、上述のTCP
セグメントが“データ”フィールドに格納された図6
(b) に示されるフォーマットを有するIPデータグラム
を生成する。この場合に、図6(b) 及び図7(a) に示さ
れるフォーマットを有するIPヘッダにおいて、“プロ
トコル”フォーマットには、その“データ”フィールド
に格納されるTCPセグメントデータのフォーマットを
規定する整数値6が設定される。また、“送信元IPア
ドレス”フィールドには、既に実行されている発信処理
(図8のステップ803の説明を参照)によって移動端
末制御ホスト装置104内の接続確立部113から移動
端末101の通信部111内の通信制御部321に対し
て付与されたIPアドレスが設定される。更に、“宛先
IPアドレス”フィールドには、音声制御ホスト装置1
08に割り当てられているIPアドレスが設定される。
Next, the communication control unit 321 executes the above-described TCP
Figure 6 with segments stored in the "data" field
An IP datagram having the format shown in (b) is generated. In this case, in the IP header having the format shown in FIGS. 6 (b) and 7 (a), the "protocol" format includes a format that defines the format of the TCP segment data stored in the "data" field. Numerical value 6 is set. In the “source IP address” field, the connection establishment unit 113 in the mobile terminal control host device 104 transmits the communication unit of the mobile terminal 101 by the transmission processing already executed (see the description of step 803 in FIG. 8). The assigned IP address is set for the communication control unit 321 in 111. Further, the "destination IP address" field contains the voice control host device 1
08 is set.

【0146】そして、通信制御部321は、上述のIP
データグラムが“インフォメーション”フィールドに格
納され、その”インフォメーション”フィールドにIP
データグラムが格納されていることを示す16進値“00
21”が“プロトコル”フィールドに格納された図6(a)
に示されるフォーマットを有するPPPフレームを生成
し、通信制御部321内に設定されている経路情報(図
8のステップ803の説明を参照)に従って、上記PP
Pフレームを移動端末制御ホスト装置104に送信す
る。以降、上述のTCPセグメント、IPデータグラ
ム、及びPPPフレームとからなるデータ単位がインタ
ーネット105内を転送される場合に、そのデータ単位
を単にTCP/IPパケットと呼ぶ。
Then, the communication control unit 321 transmits the IP
The datagram is stored in the "Information" field, and the IP
Hexadecimal value "00" indicating that the datagram is stored
FIG. 6A in which “21” is stored in the “protocol” field
A PPP frame having the format shown in FIG. 8 is generated, and according to the path information (see the description of step 803 in FIG. 8) set in the communication control unit 321, the PPP frame is generated.
The P frame is transmitted to the mobile terminal control host device 104. Hereinafter, when a data unit including the above-described TCP segment, IP datagram, and PPP frame is transferred in the Internet 105, the data unit is simply referred to as a TCP / IP packet.

【0147】このTCP/IPパケットは、それを構成
するIPデータグラムのIPヘッダに格納されている
“宛先IPアドレス”に基づいて、移動端末制御ホスト
装置104内のルーティング部114とインターネット
105内の特には図示しない中継ホスト装置によって、
音声サービスプロバイダ内のルータ装置106まで転送
された後、更に、LAN107を介して音声制御ホスト
装置108内のパケット送受信部115まで転送され
る。
This TCP / IP packet is routed to the routing unit 114 in the mobile terminal control host device 104 and the Internet 105 in the Internet 105 based on the “destination IP address” stored in the IP header of the IP datagram constituting the TCP / IP packet. In particular, by a relay host device (not shown),
After being transferred to the router device 106 in the voice service provider, the data is further transferred to the packet transmitting / receiving unit 115 in the voice control host device 108 via the LAN 107.

【0148】パケット送受信部115は、転送されてき
たTCP/IPパケットを構成するIPデータグラムの
IPヘッダの“宛先IPアドレス”フィールドに自分で
ある音声制御ホスト装置108のIPアドレスが設定さ
れていることを識別することによって、そのTCP/I
Pパケットを受信する。
The packet transmitting / receiving section 115 has its own IP address set in the “destination IP address” field of the IP header of the IP datagram constituting the transferred TCP / IP packet. That the TCP / I
Receive a P packet.

【0149】そして、パケット送受信部115は、受信
したTCP/IPパケットを構成するTCPセグメント
の“宛先ポート番号”フィールド及び“送信元ポート番
号”フィールドに文音声認識/データベース検索処理の
ための通信プロトコルを特定する16ビットの整数値が
設定されていることを確認することによって、移動端末
通信制御部116(図1)に対して受信通知を通知す
る。
The packet transmitting / receiving unit 115 stores a communication protocol for text / speech recognition / database search processing in the “destination port number” field and the “source port number” field of the TCP segment constituting the received TCP / IP packet. The mobile terminal communication control unit 116 (FIG. 1) is notified of the reception by confirming that a 16-bit integer value for specifying is set.

【0150】この通知と共に、パケット送受信部115
は、受信したTCP/IPパケットを構成するIPデー
タグラムのIPヘッダから“送信元IPアドレス”を取
り出し、上記TCP/IPパケットを構成するTCPセ
グメントの“データ”フィールドから“端末識別コー
ド”と文音声認識/データベース検索処理の開始要求コ
マンドとを取り出して、それらのデータを移動端末通信
制御部116に引き渡す。
Along with this notification, the packet transmitting / receiving unit 115
Extracts the “source IP address” from the IP header of the IP datagram constituting the received TCP / IP packet, and reads “terminal identification code” from the “data” field of the TCP segment constituting the TCP / IP packet. The voice recognition / database search process start request command is extracted, and the data is transferred to the mobile terminal communication control unit 116.

【0151】この結果、後述するようにして音声制御ホ
スト装置108から移動端末101に対して、送信許可
データが格納されたTCP/IPパケットが返信され
る。このTCP/IPパケットは、それを構成するIP
データグラムのIPヘッダに格納されている“宛先IP
アドレス”に基づいて、音声サービスプロバイダ内のル
ータ装置106と、インターネット105内の特には図
示しない中継ホスト装置によって、移動端末制御ホスト
装置104内のルーティング部114まで転送された
後、更に、PHS網103(図1)を介して移動端末1
01の通信部111内の通信制御部321(図3)まで
転送される。
As a result, a TCP / IP packet storing transmission permission data is returned from the voice control host device 108 to the mobile terminal 101 as described later. This TCP / IP packet is composed of the IP
“Destination IP” stored in the IP header of the datagram
After being transferred to the routing unit 114 in the mobile terminal control host device 104 by the router device 106 in the voice service provider and the relay host device (not shown) in the Internet 105 based on the "address", the PHS network Mobile terminal 1 via 103 (FIG. 1)
01 to the communication control unit 321 (FIG. 3) in the communication unit 111.

【0152】移動端末101の通信部111内の通信制
御部321は、転送されてきたTCP/IPパケットを
構成するIPデータグラムのIPヘッダの“宛先IPア
ドレス”フィールドに自分である移動端末101(に一
時的又は動的)に割当てられているのIPアドレスが設
定されていることを識別することによって、そのTCP
/IPパケットを受信する。
The communication control section 321 in the communication section 111 of the mobile terminal 101 stores its own mobile terminal 101 (in the “destination IP address” field of the IP header of the IP datagram constituting the transferred TCP / IP packet. By identifying that the IP address assigned to it (temporarily or dynamically) is set.
/ IP packet is received.

【0153】そして、通信制御部321は、受信したT
CP/IPパケットを構成するTCPセグメントの“宛
先ポート番号”フィールド及び“送信元ポート番号”フ
ィールドに文音声認識/データベース検索処理のための
通信プロトコルを特定する16ビットの整数値が設定さ
れていることを確認することにより、移動端末101の
制御部110内のCPU316に対して受信通知を通知
する。
Then, the communication control unit 321 transmits the received T
In the “destination port number” field and the “source port number” field of the TCP segment constituting the CP / IP packet, a 16-bit integer value for specifying a communication protocol for sentence speech recognition / database search processing is set. By confirming this, the CPU 316 in the control unit 110 of the mobile terminal 101 is notified of the reception notification.

【0154】この通知と共に、通信制御部321は、受
信したTCP/IPパケットを構成するTCPセグメン
トの“データ”フィールドから送信許可データを取り出
し、それをCPU316に引き渡す。
At the same time as this notification, the communication control unit 321 extracts the transmission permission data from the “data” field of the TCP segment constituting the received TCP / IP packet, and delivers it to the CPU 316.

【0155】CPU316は、上述の受信通知と送信許
可データを、前述した図4のステップ403で処理し、
その送信許可データをRAM317に記憶する。移動端
末101では、ユーザがタッチパネルを操作して文音声
認識/データベース検索処理の開始を指示することによ
って、CPU316が、前述した図4のステップ408
で、図3の入力部109内のマイク制御部303に対し
て、PHS通話処理の開始指示、又は文音声認識/デー
タベース検索処理を実行するためのオフライン状態での
音声入力処理の開始を指示する。これにより、ユーザ
は、通話動作又はオフライン状態での音声入力動作によ
ってマイク301(図2の201)からの音声の入力を
開始している。
The CPU 316 processes the above-described reception notification and transmission permission data in step 403 of FIG.
The transmission permission data is stored in the RAM 317. In the mobile terminal 101, when the user operates the touch panel to instruct the start of the sentence speech recognition / database search processing, the CPU 316 causes the above-described step 408 in FIG.
Then, the microphone control unit 303 in the input unit 109 in FIG. 3 is instructed to start a PHS call process or to start a speech input process in an off-line state for executing a sentence speech recognition / database search process. . As a result, the user has started inputting sound from the microphone 301 (201 in FIG. 2) through a call operation or a sound input operation in an offline state.

【0156】これ以後、CPU316により前述した図
4のステップ401→402→403→404→401
の繰返しループの1処理として実行されるステップ40
4の送信処理において、図5のステップ505、506
の判定がYESとなり、必要に応じてステップ508で
再度の発信処理が実行された後、ステップ509で、図
3に示される入力部109内のマイク制御部303から
制御部110内のRAM317に転送されてきている音
声データの送信指示が、通信部111内の通信制御部3
21に対して依頼される。
Thereafter, the CPU 316 executes steps 401 → 402 → 403 → 404 → 401 in FIG.
Step 40 executed as one processing of a repetition loop of
4 in steps 505 and 506 in FIG.
Is determined to be YES, and if necessary, the transmission processing is executed again in step 508, and then, in step 509, the data is transferred from the microphone control unit 303 in the input unit 109 to the RAM 317 in the control unit 110 shown in FIG. The transmitted voice data transmission instruction is transmitted to the communication control unit 3 in the communication unit 111.
21 is requested.

【0157】この結果、通信制御部321は、まず、図
6(c) に示されるフォーマットを有するTCPセグメン
トを生成する。この場合に、図6(c) 及び図7(b) に示
されるフォーマットを有するTCPヘッダにおいて、
“送信元ポート番号”フィールド及び“宛先ポート番
号”フィールドには、文音声認識/データベース検索処
理のための通信プロトコルを特定する16ビットの整数
値が設定される。そして、TCPセグメントの“デー
タ”フィールドには、図3に示される入力部109内の
マイク制御部303から制御部110内のRAM317
に転送されてきている音声データが格納される。
As a result, the communication control unit 321 first generates a TCP segment having the format shown in FIG. In this case, in the TCP header having the format shown in FIGS. 6 (c) and 7 (b),
In the “source port number” field and the “destination port number” field, a 16-bit integer value specifying a communication protocol for sentence speech recognition / database search processing is set. Then, the “data” field of the TCP segment includes the microphone control unit 303 in the input unit 109 and the RAM 317 in the control unit 110 shown in FIG.
Is stored.

【0158】次に、通信制御部321は、上述のTCP
セグメントが“データ”フィールドに格納された図6
(b) に示されるフォーマットを有するIPデータグラム
を生成する。この場合に、図6(b) 及び図7(a) に示さ
れるフォーマットを有するIPヘッダにおいて、“プロ
トコル”フォーマットには、その“データ”フィールド
に格納されるTCPセグメントデータのフォーマットを
規定する整数値6が設定される。また、“送信元IPア
ドレス”フィールドには、既に実行されている発信処理
(図8のステップ803の説明を参照)によって移動端
末制御ホスト装置104内の接続確立部113から移動
端末101の通信部111内の通信制御部321に対し
て付与されたIPアドレスが設定される。更に、“宛先
IPアドレス”フィールドには、音声制御ホスト装置1
08に割り当てられているIPアドレスが設定される。
Next, the communication control unit 321 executes the above-described TCP
Figure 6 with segments stored in the "data" field
An IP datagram having the format shown in (b) is generated. In this case, in the IP header having the format shown in FIGS. 6 (b) and 7 (a), the "protocol" format includes a format that defines the format of the TCP segment data stored in the "data" field. Numerical value 6 is set. In the “source IP address” field, the connection establishment unit 113 in the mobile terminal control host device 104 transmits the communication unit of the mobile terminal 101 by the transmission processing already executed (see the description of step 803 in FIG. 8). The assigned IP address is set for the communication control unit 321 in 111. Further, the "destination IP address" field contains the voice control host device 1
08 is set.

【0159】そして、通信制御部321は、上述のIP
データグラムが“インフォメーション”フィールドに格
納され、その”インフォメーション”フィールドにIP
データグラムが格納されていることを示す16進値“00
21”が“プロトコル”フィールドに格納された図6(a)
に示されるフォーマットを有するPPPフレームを生成
し、通信制御部321内に設定されている経路情報(図
8のステップ803の説明を参照)に従って、上記PP
Pフレームを移動端末制御ホスト装置104に送信す
る。
Then, the communication control unit 321 transmits the IP
The datagram is stored in the "Information" field, and the IP
Hexadecimal value "00" indicating that the datagram is stored
FIG. 6A in which “21” is stored in the “protocol” field
A PPP frame having the format shown in FIG. 8 is generated, and according to the path information (see the description of step 803 in FIG. 8) set in the communication control unit 321, the PPP frame is generated.
The P frame is transmitted to the mobile terminal control host device 104.

【0160】このTCP/IPパケットは、それを構成
するIPデータグラムのIPヘッダに格納されている
“宛先IPアドレス”に基づいて、移動端末制御ホスト
装置104内のルーティング部114とインターネット
105内の特には図示しない中継ホスト装置によって、
音声サービスプロバイダ内のルータ装置106まで転送
された後、更に、LAN107を介して音声制御ホスト
装置108内のパケット送受信部115まで転送され
る。
The TCP / IP packet is routed to the routing section 114 in the mobile terminal control host device 104 and to the Internet 105 in the Internet 105 based on the “destination IP address” stored in the IP header of the IP datagram constituting the TCP / IP packet. In particular, by a relay host device (not shown),
After being transferred to the router device 106 in the voice service provider, the data is further transferred to the packet transmitting / receiving unit 115 in the voice control host device 108 via the LAN 107.

【0161】パケット送受信部115は、転送されてき
たTCP/IPパケットを構成するIPデータグラムの
IPヘッダの“宛先IPアドレス”フィールドに自分で
ある音声制御ホスト装置108のIPアドレスが設定さ
れていることを識別することによって、そのTCP/I
Pパケットを受信する。そして、パケット送受信部11
5は、受信したTCP/IPパケットを構成するTCP
セグメントの“宛先ポート番号”フィールド及び“送信
元ポート番号”フィールドに文音声認識/データベース
検索処理のための通信プロトコルを特定する16ビット
の整数値が設定されていることを確認することにより、
移動端末通信制御部116(図1)に対して受信通知を
通知する。
The packet transmitting / receiving section 115 has its own IP address set in the “destination IP address” field of the IP header of the IP datagram constituting the transferred TCP / IP packet. That the TCP / I
Receive a P packet. Then, the packet transmitting / receiving unit 11
5 is the TCP constituting the received TCP / IP packet
By confirming that a 16-bit integer value specifying a communication protocol for sentence speech recognition / database search processing is set in the “destination port number” field and the “source port number” field of the segment,
The reception notification is notified to the mobile terminal communication control unit 116 (FIG. 1).

【0162】この通知と共に、パケット送受信部115
は、受信したTCP/IPパケットを構成するIPデー
タグラムのIPヘッダから“送信元IPアドレス”を取
り出し、上記TCP/IPパケットを構成するTCPセ
グメントの“データ”フィールドから音声データを取り
出して、それらのデータを移動端末通信制御部116に
引き渡す。
Along with this notification, the packet transmitting / receiving unit 115
Extracts the “source IP address” from the IP header of the IP datagram constituting the received TCP / IP packet, extracts the audio data from the “data” field of the TCP segment constituting the TCP / IP packet, and Is transferred to the mobile terminal communication control unit 116.

【0163】この結果、移動端末通信制御部116は、
後述するようにして文音声認識/データベース検索処理
の制御を実行し、文音声認識部117に対して受信した
音声データの認識処理を実行させ、それによって得られ
る認識音声文章データについて検索制御部118に対し
てデータベース検索処理を実行させる。そして、移動端
末通信制御部116は、後述するようにして、検索制御
部118から得た検索結果HTML文章データが格納さ
れたTCP/IPパケットを、移動端末101に対して
返信する。
As a result, the mobile terminal communication control unit 116
As will be described later, the control of the sentence speech recognition / database search process is executed, the sentence speech recognition unit 117 executes the recognition process of the received speech data, and the search control unit 118 performs the recognition speech sentence data obtained thereby. To execute a database search process. Then, the mobile terminal communication control unit 116 returns a TCP / IP packet storing the search result HTML text data obtained from the search control unit 118 to the mobile terminal 101 as described later.

【0164】このTCP/IPパケットは、それを構成
するIPデータグラムのIPヘッダに格納されている
“宛先IPアドレス”に基づいて、音声サービスプロバ
イダ内のルータ装置106と、インターネット105内
の特には図示しない中継ホスト装置によって、移動端末
制御ホスト装置104内のルーティング部114まで転
送された後、更に、PHS網103(図1)を介して移
動端末101の通信部111内の通信制御部321(図
3)まで転送される。
This TCP / IP packet is based on the “destination IP address” stored in the IP header of the IP datagram that composes the TCP / IP packet. After being transferred by the relay host device (not shown) to the routing unit 114 in the mobile terminal control host device 104, the communication control unit 321 (in the communication unit 111 of the mobile terminal 101) via the PHS network 103 (FIG. 1). It is transferred to Fig. 3).

【0165】移動端末101の通信部111内の通信制
御部321は、転送されてきたTCP/IPパケットを
構成するIPデータグラムのIPヘッダの“宛先IPア
ドレス”フィールドに自分である移動端末101(に一
時的又は動的)に割当てられているのIPアドレスが設
定されていることを識別することによって、そのTCP
/IPパケットを受信する。
The communication control unit 321 in the communication unit 111 of the mobile terminal 101 stores its own mobile terminal 101 (in the “destination IP address” field of the IP header of the IP datagram constituting the transferred TCP / IP packet). By identifying that the IP address assigned to it (temporarily or dynamically) is set.
/ IP packet is received.

【0166】そして、通信制御部321は、受信したT
CP/IPパケットを構成するTCPセグメントの“宛
先ポート番号”フィールド及び“送信元ポート番号”フ
ィールドに文音声認識/データベース検索処理のための
通信プロトコルを特定する16ビットの整数値が設定さ
れていることを確認することにより、移動端末101の
制御部110内のCPU316に対して受信通知を通知
する。
The communication control unit 321 transmits the received T
In the “destination port number” field and the “source port number” field of the TCP segment constituting the CP / IP packet, a 16-bit integer value for specifying a communication protocol for sentence speech recognition / database search processing is set. By confirming this, the CPU 316 in the control unit 110 of the mobile terminal 101 is notified of the reception notification.

【0167】この通知と共に、通信制御部321は、受
信したTCP/IPパケットを構成するTCPセグメン
トの“データ”フィールドから検索結果HTML文章デ
ータを取り出し、それをCPU316に引き渡す。
Along with this notification, the communication control unit 321 extracts the search result HTML text data from the “data” field of the TCP segment constituting the received TCP / IP packet, and transfers it to the CPU 316.

【0168】CPU316は、上述の受信通知と検索結
果HTML文章データを、前述した図4のステップ40
2で処理し、ブラウザアプリケーションを起動して、引
き渡された検索結果HTML文章データを、ハイパーテ
キストの一部であるアンカーを含むホームページ形式で
LCD表示部311(図2の203)に表示する。
The CPU 316 converts the above-described reception notification and the search result HTML text data into the above-described step 40 in FIG.
2, the browser application is started, and the delivered search result HTML text data is displayed on the LCD display unit 311 (203 in FIG. 2) in a homepage format including an anchor which is a part of the hypertext.

【0169】移動端末101のユーザが、上述のように
表示されたホームページ上のアンカーを電子ペンでタッ
チ等することにより選択すると、移動端末101は、ブ
ラウザアプリケーションの機能によって、移動端末制御
ホスト装置104を介して、上記アンカーと共にハイパ
ーテキストに含まれるURLにより示されるインターネ
ット105に接続されるホスト装置上のホームページデ
ータやJavaアプレットやファイルデータやホスト装
置のログインアカウント等の各種リソースに対して、そ
のURLによって示されるHTTPやFTP等の通信プ
ロトコルを用いて、アクセスする。
When the user of the mobile terminal 101 selects an anchor on the home page displayed as described above by touching it with an electronic pen or the like, the mobile terminal 101 uses the function of the browser application to control the mobile terminal control host device 104. The URL of various resources such as homepage data, Java applets and file data on the host device connected to the Internet 105 indicated by the URL included in the hypertext together with the anchor, together with the anchor, and the login account of the host device. Is accessed using a communication protocol such as HTTP or FTP indicated by.

【0170】ユーザは、移動端末101のタッチパネル
を操作することによって、音声制御ホスト装置108に
対して文音声認識/データベース検索処理の終了を示す
ための、文音声認識/データベース検索処理の終了要求
コマンドを指示することができる。
The user operates the touch panel of the mobile terminal 101 to request the voice control host device 108 to end the sentence speech recognition / database search processing, thereby requesting the end of the sentence speech recognition / database search processing. Can be indicated.

【0171】この場合に、上述のタッチパネルの操作
は、図3のタッチパネル制御部315において検出され
た後、制御部110内のCPU316(図3)によっ
て、それが実行される前述した図4の動作フローチャー
トに対応する制御動作において、ステップ401の判定
がYES、ステップ405及び406の判定がNOとな
って、ステップ409の他キー入力処理が実行されるこ
とにより、検出される。更に、ステップ404の送信処
理において、前述した図5のステップ501の判定がY
ESとなり、必要に応じてステップ503で発信処理が
実行された後、ステップ504において、移動端末10
1の“端末識別コード”と上述の文音声認識/データベ
ース検索処理の終了要求コマンドの送信指示が、図3の
通信部111内の通信制御部321に対して依頼され
る。
In this case, the operation of the touch panel described above is detected by the touch panel control section 315 of FIG. 3 and then executed by the CPU 316 (FIG. 3) of the control section 110. In the control operation corresponding to the flowchart, the determination is made by YES in Step 401 and NO in Steps 405 and 406, and the other key input processing of Step 409 is executed. Further, in the transmission processing of step 404, the determination of step 501 in FIG.
In step 503, the mobile terminal 10 becomes an ES, and if necessary, a calling process is executed in step 503.
The transmission control unit 321 in the communication unit 111 of FIG. 3 is requested to transmit the “terminal identification code” of No. 1 and the above-described sentence speech recognition / database search processing end request command.

【0172】この結果、通信制御部321は、まず、
“データ”フィールドに移動端末101を特定する“端
末識別コード”と文音声認識/データベース検索処理の
終了要求コマンドとが格納された図6(c) に示されるフ
ォーマットを有するTCPセグメントを生成し、次に、
そのTCPセグメントが“データ”フィールドに格納さ
れた図6(b) に示されるフォーマットを有するIPデー
タグラムを生成し、更に、そのIPデータグラムが“イ
ンフォメーション”フィールドに格納された図6(a) に
示されるフォーマットを有するPPPフレームを生成
し、それらからなるTCP/IPパケットを送信する。
この場合に、TCPヘッダ(図6(c) 、図7(b) )、I
Pヘッダ(図6(b) 、図7(a) )、及び“プロトコル”
フィールド(図6(a) )に設定される各情報は、前述の
文音声認識/データベース検索処理の開始要求コマンド
が送信される場合に設定される各情報と同一である。
As a result, the communication control unit 321 first
A TCP segment having a format shown in FIG. 6C in which a "terminal identification code" for specifying the mobile terminal 101 and a command for requesting termination of sentence speech recognition / database search processing are stored in a "data" field, next,
An IP datagram having the format shown in FIG. 6B in which the TCP segment is stored in the "data" field is generated, and the IP datagram is stored in the "information" field in FIG. 6A. A PPP frame having the format shown in (1) is generated, and a TCP / IP packet including the PPP frame is transmitted.
In this case, the TCP header (FIG. 6 (c), FIG. 7 (b)), I
P header (Fig. 6 (b), Fig. 7 (a)) and "protocol"
Each piece of information set in the field (FIG. 6 (a)) is the same as each piece of information set when the above-described sentence speech recognition / database search processing start request command is transmitted.

【0173】この結果、上述のTCP/IPパケット
は、前述の文音声認識/データベース検索処理の開始要
求コマンド等が格納されたTCP/IPパケットの場合
と全く同様にして、インターネット105を介して音声
制御ホスト装置108内のパケット送受信部115まで
転送される。
As a result, the above-mentioned TCP / IP packet is transmitted via the Internet 105 in exactly the same manner as the TCP / IP packet storing the above-mentioned sentence speech recognition / database search processing start request command and the like. The packet is transferred to the packet transmission / reception unit 115 in the control host device 108.

【0174】パケット送受信部115は、前述の文音声
認識/データベース検索処理の開始要求コマンド等が格
納されたTCP/IPパケットが転送されてきた場合と
全く同様にして、転送されてきたTCP/IPパケット
を受信し、移動端末通信制御部116(図1)に対して
受信通知を通知する。
The packet transmitting / receiving unit 115 transmits the transferred TCP / IP in exactly the same manner as when the TCP / IP packet storing the above-described sentence speech recognition / database search processing start request command and the like is transferred. It receives the packet and notifies the mobile terminal communication control unit 116 (FIG. 1) of a reception notification.

【0175】この通知と共に、パケット送受信部115
は、受信したTCP/IPパケットを構成するTCPセ
グメントの“データ”フィールドから“端末識別コー
ド”と文音声認識/データベース検索処理の終了要求コ
マンドとを取り出して、それらのデータを移動端末通信
制御部116に引き渡す。
Along with this notification, the packet transmitting / receiving unit 115
Extracts the “terminal identification code” and the command to end the sentence / speech recognition / database search process from the “data” field of the TCP segment constituting the received TCP / IP packet, and extracts the data from the mobile terminal communication control unit. Hand over to 116.

【0176】この結果、移動端末通信制御部116は、
後述するようにしてその移動端末101に対する文音声
認識/データベース検索処理を終了する。 <移動端末通信制御部116、文音声認識部117、及
び検索制御部118の概略動作>次に、音声制御ホスト
装置108内の移動端末通信制御部116、文音声認識
部117、及び検索制御部118の概略動作について説
明する。
As a result, the mobile terminal communication control unit 116
As described later, the sentence speech recognition / database search processing for the mobile terminal 101 ends. <Schematic Operation of Mobile Terminal Communication Control Unit 116, Sentence / Speech Recognition Unit 117, and Search Control Unit 118> Next, the mobile terminal communication control unit 116, sentence / speech recognition unit 117, and search control unit in the voice control host device 108 The schematic operation of 118 will be described.

【0177】移動端末通信制御部116は、文音声認識
/データベース検索処理の開始要求コマンドを送信した
移動端末101に割当てられている“端末識別コード”
(上記コマンドを転送してきたTCPセグメントに格納
されている)毎に、図12に示されるデータ構造を有す
る処理端末登録テーブルにエントリを登録すると共に、
音声データの受信用のバッファファイル(音声バッファ
ファイル)と、認識音声文章データの一時保存用のバッ
ファファイル(文章バッファファイル)と、検索結果H
TML文章データの送信用のバッファファイル(検索結
果バッファファイル)、及びその他の必要なバッファフ
ァイルを音声制御ホスト装置108が管理するファイル
システム上に作成する。また、移動端末通信制御部11
6は、上記エントリとファイルの登録に成功すると、上
記コマンドを転送してきたIPデータグラムに格納され
ていた“送信元IPアドレス”の移動端末101に向け
て、送信許可データを返信する。
The mobile terminal communication control unit 116 transmits the “terminal identification code” assigned to the mobile terminal 101 that has transmitted the command to start the sentence speech recognition / database search process.
An entry is registered in the processing terminal registration table having the data structure shown in FIG.
A buffer file for receiving voice data (voice buffer file), a buffer file for temporarily storing recognized voice text data (text buffer file), and a search result H
A buffer file for transmitting TML text data (search result buffer file) and other necessary buffer files are created on a file system managed by the voice control host device 108. Also, the mobile terminal communication control unit 11
6 successfully registers the entry and the file, and returns the transmission permission data to the mobile terminal 101 of the “source IP address” stored in the IP datagram that has transmitted the command.

【0178】移動端末通信制御部116は、それ以後移
動端末101から受信した音声データを、その“送信元
IPアドレス”(それを転送してきたIPデータグラム
に格納されている)に対応する処理端末登録テーブルの
エントリから特定される音声バッファファイルに追加書
き込みする。
The mobile terminal communication control unit 116 converts the voice data received from the mobile terminal 101 thereafter into the processing terminal corresponding to the “source IP address” (stored in the IP datagram that transferred the data). Write additionally to the audio buffer file specified from the entry in the registration table.

【0179】文音声認識部117は、図12に示される
処理端末登録テーブルのエントリ毎に、各エントリから
特定される音声バッファファイルに音声データが受信さ
れていればそれに対して文音声認識処理を実行し、その
結果得られる認識音声文章データを上記各エントリに対
応する文章バッファファイルに追加書き込みする。
The sentence / speech recognition unit 117 performs a sentence / speech recognition process on each entry of the processing terminal registration table shown in FIG. 12 if the speech data is received in the speech buffer file specified from each entry. Then, the recognition voice text data obtained as a result is additionally written to the text buffer file corresponding to each of the above entries.

【0180】検索制御部118(図1)は、図12に示
される処理端末登録テーブルのエントリ毎に、各エント
リから特定される文章バッファファイルに認識音声文章
データが得られていればそれに対してデータベース検索
処理を実行し、その結果得られる検索結果HTML文章
データを上記各エントリに対応する検索結果バッファフ
ァイルに追加書き込みする。
For each entry in the processing terminal registration table shown in FIG. 12, the search control unit 118 (FIG. 1) responds to the sentence buffer file specified by each entry if the recognized speech sentence data is obtained. A database search process is executed, and the search result HTML text data obtained as a result is additionally written into a search result buffer file corresponding to each entry.

【0181】移動端末通信制御部116は、処理端末登
録テーブルのエントリ毎に、各エントリから特定される
検索結果バッファファイルに検索結果HTML文章デー
タが得られていれば、それを各エントリに登録されてい
る“送信元IPアドレス”の移動端末101に向けて返
信する。
For each entry in the processing terminal registration table, if the search result HTML text data is obtained in the search result buffer file specified from each entry, the mobile terminal communication control unit 116 registers it in each entry. To the mobile terminal 101 of the “source IP address”.

【0182】移動端末通信制御部116は、文音声認識
/データベース検索処理の終了要求コマンドを受信した
処理端末登録テーブルのエントリ、又は最終アクセス時
刻が現在時刻から一定時間前の時刻よりも更に前の時刻
である処理端末登録テーブルのエントリについて、その
エントリの内容を削除し、それから特定される各バッフ
ァファイルを削除する。 <移動端末通信制御部116の詳細動作>図9〜図11
は、上記機能を実現するために、移動端末通信制御部1
16が実行する制御動作を示す動作フローチャートであ
る。この動作フローチャートは、移動端末通信制御部1
16を制御する特には図示しないプロセッサが、特には
図示しない制御プログラムを実行する動作として実現さ
れる。
The mobile terminal communication control unit 116 determines whether the entry in the processing terminal registration table that has received the end request command for the sentence speech recognition / database search processing or the last access time is earlier than the time that is a fixed time before the current time. For the entry in the processing terminal registration table that is the time, the contents of the entry are deleted, and each buffer file specified from that entry is deleted. <Detailed Operation of Mobile Terminal Communication Control Unit 116> FIGS. 9 to 11
Is a mobile terminal communication control unit 1 for realizing the above function.
16 is an operation flowchart illustrating a control operation performed by the control unit 16. This operation flowchart is based on the mobile terminal communication control unit 1.
A processor (not shown) for controlling the CPU 16 is realized as an operation for executing a control program (not shown).

【0183】まず、ステップ901で、音声制御ホスト
装置108内のパケット送受信部115(図1)から受
信通知が通知されたか否かが判定される。前述したよう
に、パケット送受信部115は、インターネット105
から転送されてきたTCP/IPパケットを構成するI
PデータグラムのIPヘッダの“宛先IPアドレス”フ
ィールドに自分である音声制御ホスト装置108のIP
アドレスが設定されていることを識別することにより、
そのTCP/IPパケットを受信し、かつ、それを構成
するTCPセグメントの“宛先ポート番号”フィールド
及び“送信元ポート番号”フィールドに文音声認識/デ
ータベース検索処理のための通信プロトコルを特定する
16ビットの整数値が設定されていることを確認するこ
とによって、移動端末通信制御部116に対して受信通
知を通知する。この受信通知は、文音声認識/データベ
ース検索処理の開始要求コマンド、文音声認識/データ
ベース検索処理の対象である音声データ、又は文音声認
識/データベース検索処理の終了要求コマンドの何れか
に関する受信通知である。
First, in step 901, it is determined whether or not a reception notification has been received from the packet transmitting / receiving unit 115 (FIG. 1) in the voice control host device. As described above, the packet transmitting / receiving unit 115 communicates with the Internet 105
I that constitutes the TCP / IP packet transferred from
In the "destination IP address" field of the IP header of the P datagram, the IP address of the voice control host
By identifying that the address is set,
A 16-bit that receives the TCP / IP packet and specifies a communication protocol for sentence speech recognition / database search processing in the "destination port number" field and the "source port number" field of the TCP segment constituting the TCP / IP packet By confirming that an integer value is set, the mobile terminal communication control unit 116 is notified of the reception notification. This reception notification is a reception notification relating to any one of a sentence speech recognition / database search processing start request command, speech data to be subjected to sentence speech recognition / database search processing, and a sentence speech recognition / database search processing end request command. is there.

【0184】パケット送受信部115から受信通知が通
知されステップ901の判定がYESとなると、ステッ
プ902で、パケット送受信部115から受信通知と共
に引き渡されたデータが取り込まれる。この場合に、受
信通知が、文音声認識/データベース検索処理の開始要
求コマンドの受信通知である場合には、“送信元IPア
ドレス”と“端末識別コード”と上記コマンドとが取り
込まれる。また、受信通知が、音声データの受信通知で
ある場合には、“送信元IPアドレス”と音声データと
が取り込まれる。更に、受信通知が、文音声認識/デー
タベース検索処理の終了要求コマンドの受信通知である
場合には、“端末識別コード”とそのコマンドとが取り
込まれる。
When the reception notification is notified from the packet transmission / reception unit 115 and the determination in step 901 is YES, in step 902, the data transferred together with the reception notification from the packet transmission / reception unit 115 is fetched. In this case, if the reception notification is a reception notification of a sentence speech recognition / database search process start request command, the “source IP address”, the “terminal identification code”, and the above command are fetched. When the reception notification is a reception notification of audio data, the “source IP address” and the audio data are captured. Further, when the reception notification is a reception notification of a command for requesting termination of sentence speech recognition / database search processing, the “terminal identification code” and the command are fetched.

【0185】ステップ902の処理の後に、図9のステ
ップ903、図10のステップ907、又は図10のス
テップ909の判定が順に検査され、何れかの判定結果
がYESとなる。即ち、ステップ902でパケット送受
信部115から引き渡されたデータが、文音声認識/デ
ータベース検索処理の開始要求コマンドに関するもので
ある場合はステップ903の判定がYESとなってステ
ップ904〜906が実行され、音声データに関するも
のである場合は図10のステップ907の判定がYES
となってステップ908が実行され、文音声認識/デー
タベース検索処理の終了要求コマンドに関するものであ
る場合には図10のステップ909の判定がYESとな
ってステップ910と911が実行される。
After the processing of step 902, the judgments of step 903 of FIG. 9, step 907 of FIG. 10, or step 909 of FIG. 10 are sequentially examined, and any judgment result becomes YES. That is, if the data delivered from the packet transmitting / receiving unit 115 in step 902 is related to a command requesting start of sentence speech recognition / database search processing, the determination in step 903 is YES, and steps 904 to 906 are executed. If it is related to voice data, the determination in step 907 of FIG. 10 is YES.
Then, step 908 is executed, and when the command is related to the end request command of the sentence speech recognition / database search processing, the determination in step 909 in FIG. 10 is YES, and steps 910 and 911 are executed.

【0186】パケット送受信部115から受信通知が通
知されておらずステップ901の判定がNOの場合、又
は上述の各コマンド又は音声データの受信に対応する処
理の後には、図11のステップ912と913で検索結
果HTML文章データの送信処理が実行され、それに続
くステップ914及び915で最終アクセス時刻が一定
時間以上前である移動端末101との通信を終了させる
ための処理が行われた後、再び図9のステップ901の
判定処理に戻る。
If the reception notification has not been received from the packet transmission / reception unit 115 and the determination in step 901 is NO, or after the processing corresponding to the reception of each command or voice data described above, steps 912 and 913 in FIG. The transmission processing of the search result HTML text data is executed in Steps 914 and 915. After the processing for terminating the communication with the mobile terminal 101 whose last access time is a predetermined time or more is performed in Steps 914 and 915, the processing shown in FIG. The process returns to the determination process of Step 901 of Step 9.

【0187】ステップ901の判定がYESであり、ス
テップ902でパケット送受信部115から引き渡され
たデータが文音声認識/データベース検索処理の開始要
求コマンドに関するものである場合において、ステップ
903の判定がYESとなって実行されるステップ90
4〜905の処理について説明する。
If the determination in step 901 is YES and the data passed from packet transmitting / receiving section 115 in step 902 is related to a command requesting start of sentence speech recognition / database search processing, the determination in step 903 is YES. Step 90 to be executed
The processing of 4-905 will be described.

【0188】まず、ステップ904では、音声データの
受信用のバッファファイルである音声バッファファイル
と、認識音声文章の一時保存用のバッファファイルであ
る文章バッファファイルと、検索制御部118が使用す
る検索済キーワードバッファファイル及び検索インデッ
クスバッファファイルと、検索結果HTML文章データ
の送信用のバッファファイルである検索結果バッファフ
ァイルとが、音声制御ホスト装置108が管理するファ
イルシステム上に作成される。
First, in step 904, an audio buffer file which is a buffer file for receiving audio data, a text buffer file which is a buffer file for temporarily storing a recognized voice text, and a search completed file used by the search control unit 118. A keyword buffer file, a search index buffer file, and a search result buffer file that is a buffer file for transmitting search result HTML text data are created on a file system managed by the voice control host device 108.

【0189】次に、ステップ904では、移動端末通信
制御部116内の特には図示しないメモリに記憶される
図12に示されるデータ構造を有する処理端末登録テー
ブルに、1つのエントリ(横1行のデータ組)が確保さ
れる。そして、そのエントリに、“端末識別コード”
と、“送信元IPアドレス”と、最終アクセス時刻と、
音声バッファファイル名と、文章バッファファイル名
と、検索済キーワードバッファファイル名と、検索イン
デックスバッファファイル名と、検索結果バッファファ
イル名とが、登録される。“端末識別コード”は、ステ
ップ902でパケット送受信部115から引き渡された
データであり、移動端末101から転送されてきたTC
P/IPパケットを構成するTCPセグメントの“デー
タ”フィールドに格納されていたものである(図6(c)
参照)。“送信元IPアドレス”は、やはりステップ9
02においてパケット送受信部115から引き渡された
データであり、移動端末101から転送されてきたTC
P/IPパケットを構成するIPデータグラムのIPヘ
ッダに格納されていたものである(図6(b) 、図7(a)
参照)。最終アクセス時刻には、現在時刻が設定され
る。各バッファファイル名は、ステップ904で作成さ
れた各ファイルを示すファイル名である。
Next, at step 904, one entry (one horizontal row) is stored in the processing terminal registration table having the data structure shown in FIG. 12 stored in the memory (not shown) in the mobile terminal communication control unit 116. Data set) is secured. Then, in the entry, "terminal identification code"
, “Source IP address”, last access time,
An audio buffer file name, a text buffer file name, a searched keyword buffer file name, a search index buffer file name, and a search result buffer file name are registered. The “terminal identification code” is data transferred from the packet transmission / reception unit 115 in step 902, and is the TC transmitted from the mobile terminal 101.
This is stored in the "data" field of the TCP segment constituting the P / IP packet (FIG. 6 (c)).
reference). The “source IP address” is also stored in step 9
02 is the data transferred from the packet transmitting / receiving unit 115, and is the TC transferred from the mobile terminal 101.
This is stored in the IP header of the IP datagram constituting the P / IP packet (FIGS. 6B and 7A).
reference). The current time is set as the last access time. Each buffer file name is a file name indicating each file created in step 904.

【0190】ステップ905の処理の後、ステップ90
6では、ステップ902でパケット送受信部115から
引き渡され処理端末登録テーブルの上記エントリに登録
された“送信元IPアドレス”に向けて、送信許可デー
タが返信される。
After the processing of step 905, step 90
In step 6, the transmission permission data is returned to the "source IP address" passed from the packet transmitting / receiving unit 115 in step 902 and registered in the entry of the processing terminal registration table.

【0191】具体的には、移動端末通信制御部116
は、“送信元IPアドレス”への送信許可データの返信
を、パケット送受信部115(図1)に対して依頼す
る。この結果、パケット送受信部115は、まず、図6
(c) に示されるフォーマットを有するTCPセグメント
を生成する。この場合、図6(c) 及び図7(b) に示され
るフォーマットを有するTCPヘッダにおいて、“送信
元ポート番号”フィールド及び“宛先ポート番号”フィ
ールドには、文音声認識/データベース検索処理のため
の通信プロトコルを特定する16ビットの整数値が設定
される。そして、TCPセグメントの“データ”フィー
ルドには、送信許可データが格納される。
More specifically, mobile terminal communication control section 116
Requests the packet transmission / reception unit 115 (FIG. 1) to return transmission permission data to the “source IP address”. As a result, the packet transmitting / receiving unit 115 first
Generate a TCP segment having the format shown in (c). In this case, in the TCP header having the format shown in FIGS. 6 (c) and 7 (b), the "source port number" field and the "destination port number" field contain text / speech recognition / database search processing. A 16-bit integer value specifying the communication protocol is set. Then, transmission permission data is stored in the “data” field of the TCP segment.

【0192】次に、パケット送受信部115は、上述の
TCPセグメントが“データ”フィールドに格納された
図6(b) に示されるフォーマットを有するIPデータグ
ラムを生成する。この場合に、図6(b) 及び図7(a) に
示されるフォーマットを有するIPヘッダにおいて、
“プロトコル”フォーマットには、その“データ”フィ
ールドに格納されるTCPセグメントデータのフォーマ
ットを規定する整数値6が設定される。また、“送信元
IPアドレス”フィールドには、音声制御ホスト装置1
08に割当てられているIPアドレスが設定される。更
に、“宛先IPアドレス”フィールドには、図9のステ
ップ902でパケット送受信部115から引き渡された
“送信元IPアドレス”が設定される。
Next, the packet transmitting / receiving unit 115 generates an IP datagram having the format shown in FIG. 6B in which the above-mentioned TCP segment is stored in the “data” field. In this case, in the IP header having the format shown in FIGS. 6 (b) and 7 (a),
In the “protocol” format, an integer value 6 defining the format of the TCP segment data stored in the “data” field is set. The “source IP address” field contains the voice control host device 1
08 is set. Further, in the “destination IP address” field, the “source IP address” passed from the packet transmission / reception unit 115 in step 902 of FIG. 9 is set.

【0193】そして、パケット送受信部115は、上述
のIPデータグラムが格納されたLAN107上のプロ
トコルに従ったフレームを生成し、それをLAN107
に送出する。例えば、LAN107がイーサネット方式
によるローカルエリアネットワークであれば、上記フレ
ームは、イーサネットフレームである。
Then, the packet transmitting / receiving unit 115 generates a frame according to the protocol on the LAN 107 in which the above-described IP datagram is stored, and transmits the frame to the LAN 107
To send to. For example, if the LAN 107 is a local area network based on the Ethernet system, the frame is an Ethernet frame.

【0194】上記フレームとIPデータグラムとTCP
セグメントとから構成されるTCP/IPパケットは、
それを構成するIPデータグラムのIPヘッダに格納さ
れている“宛先IPアドレス”に基づいて、ルータ装置
106及びインターネット105を介して移動端末制御
ホスト装置104まで転送された後、更に、PHS網1
03及び無線基地(又は有線接続装置)102を介し
て、移動端末101の通信部111内の通信制御部32
1(図3)まで転送される。
The above frame, IP datagram and TCP
A TCP / IP packet composed of a segment and
After being transferred to the mobile terminal control host device 104 via the router device 106 and the Internet 105 based on the “destination IP address” stored in the IP header of the IP datagram constituting the PHS network,
03 and the communication control unit 32 in the communication unit 111 of the mobile terminal 101 via the wireless base (or wired connection device) 102
1 (FIG. 3).

【0195】これ以降、移動端末101から音声制御ホ
スト装置108へは、前述したようにして、音声データ
が転送されてくる。ステップ906の処理の後は、図1
1のステップ912と913で検索結果HTML文章デ
ータの送信処理が実行され、それに続くステップ914
及び915で最終アクセス時刻が一定時間以上前である
移動端末101との通信を終了させるための処理が行わ
れた後、再び図9のステップ901の判定処理に戻る。
Thereafter, voice data is transferred from the mobile terminal 101 to the voice control host device 108 as described above. After the processing of step 906, FIG.
In steps 912 and 913 of step 1, transmission processing of search result HTML text data is executed, and the subsequent step 914
In steps 915 and 915, a process for terminating communication with the mobile terminal 101 whose last access time is a predetermined time or more is performed, and then the process returns to step 901 in FIG.

【0196】次に、図9のステップ901の判定がYE
Sであり、ステップ902でパケット送受信部115か
ら引き渡されたデータが音声データである場合におい
て、図10のステップ907の判定がYESとなって実
行されるステップ908の処理について説明する。
Next, the determination in step 901 in FIG.
Step S 908, which is executed when the determination in step 907 in FIG. 10 is YES when the data delivered from the packet transmitting / receiving unit 115 in step S 902 is voice data, will be described.

【0197】即ち、ステップ908では、図9のステッ
プ902でパケット送受信部115から引き渡されたの
と同じ“送信元IPアドレス”が記憶されている処理端
末登録テーブル(図12)のエントリが検索され、該当
するエントリに記憶されている音声バッファファイル名
に対応する音声バッファファイル(図9のステップ90
4参照)に、図9のステップ902でパケット送受信部
115から引き渡された音声データが追加書き込みされ
る。なお、追加書込み時の音声バッファファイルのサイ
ズは、音声制御ホスト装置108が管理するファイルシ
ステムによって自動的に調整される。
That is, in step 908, an entry in the processing terminal registration table (FIG. 12) in which the same “source IP address” passed from the packet transmitting / receiving section 115 in step 902 in FIG. 9 is stored is searched. The audio buffer file corresponding to the audio buffer file name stored in the corresponding entry (step 90 in FIG. 9)
4), the audio data transferred from the packet transmitting / receiving unit 115 in step 902 of FIG. 9 is additionally written. The size of the audio buffer file at the time of additional writing is automatically adjusted by the file system managed by the audio control host device 108.

【0198】また、ステップ908では、上記該当する
エントリに記憶されている最終アクセス時刻が、現在時
刻に更新される。このようにして、移動端末101毎
(“端末識別コード”毎)の音声バッファファイルを介
して、移動端末通信制御部116から文音声認識部11
7(図1)に音声データが引き渡される。文音声認識部
117は、後述するように、図12に示される処理端末
登録テーブルのエントリ毎に、各エントリから特定され
る音声バッファファイルに音声データが受信されていれ
ばそれに対して文音声認識処理を実行し、その結果得ら
れる認識音声文章データを上記各エントリに対応する文
章バッファファイルに追加書き込みすることになる。更
に、検索制御部118(図1)は、後述するように、図
12に示される処理端末登録テーブルのエントリ毎に、
各エントリから特定される文章バッファファイルに認識
音声文章データが得られていればそれに対してデータベ
ース検索処理を実行し、その結果得られる検索結果HT
ML文章データを上記各エントリに対応する検索結果バ
ッファファイルに追加書き込みすることになる。
At step 908, the last access time stored in the relevant entry is updated to the current time. In this way, the mobile terminal communication control unit 116 sends the sentence voice recognition unit 11 via the voice buffer file for each mobile terminal 101 (for each “terminal identification code”).
7 (FIG. 1) is delivered. As will be described later, the sentence speech recognition unit 117 performs, for each entry of the processing terminal registration table shown in FIG. 12, the sentence speech recognition if the speech data is received in the speech buffer file specified from each entry. The process is executed, and the resulting recognized voice text data is additionally written to the text buffer file corresponding to each of the entries. Further, as described later, the search control unit 118 (FIG. 1) performs, for each entry of the processing terminal registration table shown in FIG.
If the recognized voice sentence data is obtained in the sentence buffer file specified from each entry, a database search process is executed on the data, and a search result HT obtained as a result is obtained.
The ML text data is additionally written to the search result buffer file corresponding to each of the entries.

【0199】ステップ908の処理の後は、図11のス
テップ912と913で検索結果HTML文章データの
送信処理が実行され、それに続くステップ914及び9
15で最終アクセス時刻が一定時間以上前である移動端
末101との通信を終了させるための処理が行われた
後、再び図9のステップ901の判定処理に戻る。
After the processing in step 908, transmission processing of the retrieval result HTML text data is executed in steps 912 and 913 in FIG. 11, and the subsequent steps 914 and 9
After the processing for terminating the communication with the mobile terminal 101 whose final access time is a fixed time or more in 15 is performed, the process returns to the determination processing in step 901 in FIG. 9 again.

【0200】次に、図9のステップ901の判定がYE
Sであり、ステップ902でパケット送受信部115か
ら引き渡されたデータが文音声認識/データベース検索
処理の終了要求コマンドに関するものである場合におい
て、図10のステップ909の判定がYESとなって実
行されるステップ910と911の処理について説明す
る。
Next, the determination in step 901 in FIG.
If it is S and the data transferred from the packet transmitting / receiving unit 115 in step 902 is related to a command for requesting termination of sentence speech recognition / database search processing, the determination in step 909 in FIG. The processing of steps 910 and 911 will be described.

【0201】まず、ステップ910で、図9のステップ
902でパケット送受信部115から引き渡されたのと
同じ“端末識別コード”が記憶されている処理端末登録
テーブル(図12)のエントリの内容が全て削除され
る。
First, in step 910, all the contents of the entries in the processing terminal registration table (FIG. 12) storing the same “terminal identification code” passed from the packet transmitting / receiving section 115 in step 902 in FIG. Deleted.

【0202】次に、ステップ911で、上記エントリに
記憶されていた音声バッファファイル名、文章バッファ
ファイル名、検索済キーワードバッファファイル名、検
索インデックスバッファファイル名、及び検索結果バッ
ファファイル名に対応する各バッファファイルが、音声
制御ホスト装置108が管理するファイルシステム上か
ら削除される。
Next, in step 911, each of the audio buffer file name, the sentence buffer file name, the searched keyword buffer file name, the search index buffer file name, and the search result buffer file name stored in the above entry is read. The buffer file is deleted from the file system managed by the audio control host device 108.

【0203】ステップ911の処理の後は、図11のス
テップ912と913で検索結果HTML文章データの
送信処理が実行され、それに続くステップ914及び9
15で最終アクセス時刻が一定時間以上前である移動端
末101との通信を終了させるための処理が行われた
後、再び図9のステップ901の判定処理に戻る。
After the processing of step 911, transmission processing of the retrieval result HTML text data is executed in steps 912 and 913 of FIG.
After the processing for terminating the communication with the mobile terminal 101 whose final access time is a fixed time or more in 15 is performed, the process returns to the determination processing in step 901 in FIG. 9 again.

【0204】パケット送受信部115から受信通知が通
知されておらず図9のステップ901の判定がNOの場
合、又は上述の各コマンド又は音声データの受信に対応
する処理の後に実行される、図11のステップ912と
913の処理、及びそれに続くステップ914と915
の処理について説明する。
When the reception notification is not notified from the packet transmitting / receiving unit 115 and the determination in step 901 in FIG. 9 is NO, or after the processing corresponding to the reception of each command or voice data described above, FIG. Processing of steps 912 and 913, and subsequent steps 914 and 915
Will be described.

【0205】これらの処理において、文音声認識部11
7から得られている検索結果HTML文章データの送信
処理が実行される。まず、ステップ912では、処理端
末登録テーブル(図12)において、検索結果バッファ
ファイル名に対応する検索結果バッファファイルに検索
結果HTML文章データが存在するエントリがあるか否
かが判定される。
In these processes, the sentence speech recognition unit 11
7 is transmitted. First, in step 912, it is determined whether or not the search result buffer file corresponding to the search result buffer file name has an entry in which search result HTML text data exists in the processing terminal registration table (FIG. 12).

【0206】そのようなエントリが無くステップ912
の判定がNOの場合には、ステップ913での検索結果
HTML文章データの送信処理は実行されずに、ステッ
プ914及び915の処理に進む。
If there is no such entry, step 912
Is negative, the process of transmitting the search result HTML text data in step 913 is not executed, and the process proceeds to steps 914 and 915.

【0207】上述のようなエントリが1つ以上存在しス
テップ912の判定がYESの場合には、ステップ91
3で、該当するエントリ毎に、そのエントリに記憶され
ている“送信元IPアドレス”に向けて、そのエントリ
に記憶されている検索結果バッファファイル名に対応す
る検索結果バッファファイル内の検索結果HTML文章
データが送信され、その送信された検索結果HTML文
章データが上記検索結果バッファファイルから削除され
る。なお、削除時の検索結果バッファファイルのサイズ
は、音声制御ホスト装置108が管理するファイルシス
テムによって自動的に調整される。
If there is one or more entries as described above and the determination in step 912 is YES, step 91
At 3, the search result HTML in the search result buffer file corresponding to the search result buffer file name stored in the entry is directed to the “source IP address” stored in the entry for each corresponding entry. The sentence data is transmitted, and the transmitted search result HTML sentence data is deleted from the search result buffer file. The size of the search result buffer file at the time of deletion is automatically adjusted by the file system managed by the voice control host device 108.

【0208】上述のステップ913の処理の後又はステ
ップ912の判定がNOである場合に、ステップ914
が実行される。ここでは、処理端末登録テーブル(図1
2)のエントリのうち、最終アクセス時刻が現在時刻か
ら一定時間前の時刻より更に前の時刻であるエントリが
検出され、そのエントリの内容が全て削除される。
After the processing in step 913 or when the determination in step 912 is NO, step 914
Is executed. Here, the processing terminal registration table (FIG. 1)
Of the entries in 2), the entry whose last access time is a time earlier than the current time by a certain time before the current time is detected, and all the contents of the entry are deleted.

【0209】また、ステップ915で、上記エントリに
記憶されていた音声バッファファイル名、文章バッファ
ファイル名、検索済キーワードバッファファイル名、検
索インデックスバッファファイル名、及び検索結果バッ
ファファイル名に対応する各バッファファイルが、音声
制御ホスト装置108が管理するファイルシステム上か
ら削除される。
In step 915, each buffer corresponding to the audio buffer file name, text buffer file name, searched keyword buffer file name, search index buffer file name, and search result buffer file name stored in the above entry The file is deleted from the file system managed by the voice control host device 108.

【0210】ステップ915の処理の後、再び図9のス
テップ901の判定処理に戻る。 <文音声認識部117の詳細動作>図13は、文音声認
識部117の機能ブロック図である。
After the processing in step 915, the process returns to the determination processing in step 901 in FIG. <Detailed Operation of Sentence Speech Recognition Unit 117> FIG. 13 is a functional block diagram of the sentence speech recognition unit 117.

【0211】この文音声認識部117は、前述したよう
に、図12に示される処理端末登録テーブルのエントリ
毎に、各エントリから特定される音声バッファファイル
に音声データが受信されていればそれに対して文音声認
識を実行し、その結果得られる認識音声文章データを上
記各エントリに対応する文章バッファファイルに追加書
き込みする。
As described above, this sentence speech recognition unit 117 performs, for each entry in the processing terminal registration table shown in FIG. 12, if speech data is received in a speech buffer file specified from each entry, Then, sentence speech recognition is executed, and the resulting recognized speech sentence data is additionally written into a sentence buffer file corresponding to each of the above entries.

【0212】上述のエントリ毎の音声バッファファイル
からの音声データの読出しと文章バッファファイルへの
認識音声文章データの書込みは、図13の入出力制御部
1309が制御する。まず、この入出力制御部1309
の制御動作につき説明する。図14は、入出力制御部1
309が実行する制御動作を示す動作フローチャートで
ある。この動作フローチャートは、入出力制御部130
9を制御する特には図示しないプロセッサが、特には図
示しない制御プログラムを実行する動作として実現され
る。
The reading of the voice data from the voice buffer file for each entry and the writing of the recognized voice text data to the text buffer file are controlled by the input / output control unit 1309 in FIG. First, the input / output control unit 1309
Will be described. FIG. 14 shows the input / output control unit 1
309 is an operation flowchart illustrating a control operation performed by the control unit. This operation flowchart is based on the input / output control unit 130.
9 is realized as an operation of executing a control program (not shown).

【0213】まず、ステップ1401では、処理端末登
録テーブル(図12)において、音声バッファファイル
名に対応する音声バッファファイルに音声データが記憶
されているエントリが存在するか否かが判定される。
First, in step 1401, it is determined whether or not an entry in which audio data is stored in the audio buffer file corresponding to the audio buffer file name exists in the processing terminal registration table (FIG. 12).

【0214】そのようなエントリが存在しステップ14
01の判定がYESならば、ステップ1402で、該当
するエントリ毎に、そのエントリに記憶されている“端
末識別コード”と、そのエントリに記憶されている音声
バッファファイル名に対応する音声バッファファイル上
の音声データとが、図13の入力バッファキュー130
1に書き込まれ、その音声データが音声バッファファイ
ルから削除される。
If there is such an entry and step 14
If the determination of 01 is YES, in step 1402, for each entry, the "terminal identification code" stored in the entry and the audio buffer file name corresponding to the audio buffer file name stored in the entry are displayed. Of the input buffer queue 130 shown in FIG.
1 and the audio data is deleted from the audio buffer file.

【0215】入力バッファキュー1301は、それがキ
ューイングしている音声データを、音声区間検出部13
02に順次流し込む機能を有する。音声区間検出部13
02以降に接続されている音声分析部1303、音素認
識部1304、単語認識部1306、及び文章認識部1
307は、データ処理パイプラインを形成しており、相
互に独立して、入力データを処理する機能を有する。ま
た、1302〜1307の各部分は、現在処理している
音声データに対応する“端末識別コード”(入力バッフ
ァキュー1301から入力される)を認識することがで
きる。従って、最終的に文章認識部1307から出力バ
ッファキュー1308へは、“端末識別コード”と認識
音声文章データとの組が出力されることになる。
The input buffer queue 1301 stores the audio data queued in the input buffer queue 1301
02. Voice section detector 13
02, the speech analysis unit 1303, the phoneme recognition unit 1304, the word recognition unit 1306, and the text recognition unit 1
A data processing pipeline 307 has a function of processing input data independently of each other. Each of the parts 1302 to 1307 can recognize the “terminal identification code” (input from the input buffer queue 1301) corresponding to the audio data currently being processed. Therefore, finally, a set of the “terminal identification code” and the recognized voice text data is output from the text recognition unit 1307 to the output buffer queue 1308.

【0216】ステップ1402の処理の後又はステップ
1401の判定がNOの場合には、ステップ1403
で、図13の出力バッファキュー1308に、“端末識
別コード”と認識音声文章データの組が得られているか
否かが判定される。
After the processing in step 1402 or when the determination in step 1401 is NO, step 1403
Then, it is determined whether or not a set of “terminal identification code” and recognized speech text data has been obtained in the output buffer queue 1308 of FIG.

【0217】そのような組が得られておりステップ14
03の判定がYESならば、ステップ1404で、出力
バッファキュー1308内の組毎に、その組の“端末識
別コード”に対応する処理端末登録テーブルのエントリ
について、そのエントリに記憶されている文章バッファ
ファイル名に対応する文章バッファファイルに、出力バ
ッファキュー1308内の組の認識音声文章データが追
加書き込みされる。
When such a set has been obtained, step 14 is executed.
If the determination in step 03 is YES, in step 1404, for each set in the output buffer queue 1308, for the entry in the processing terminal registration table corresponding to the "terminal identification code" of that set, the text buffer stored in that entry The set of recognized speech text data in the output buffer queue 1308 is additionally written to the text buffer file corresponding to the file name.

【0218】ステップ1404の処理の後又はステップ
1403の判定がNOの場合には、再びステップ140
1の判定処理が実行される。以上のようにして文音声認
識部117は、流れ作業的に効率良く、複数の移動端末
101から要求された音声データに対する文音声認識処
理を実行することができる。
After the processing in step 1404 or when the determination in step 1403 is NO, step 140
1 is performed. As described above, the sentence / speech recognition unit 117 can efficiently execute the sentence / speech recognition process on the speech data requested by the plurality of mobile terminals 101 in a streamlined manner.

【0219】次に、文音声認識処理を実現するための1
302〜1307の各部分の機能につき、以下に説明す
る。なお、以下に説明する各方式は、例えば、文献「電
子・情報工学入門シリーズ2 音響・音声工学」(古井
著、近代科学社)第14章」を参照することにより、実
現することができる。
Next, 1 for realizing the sentence speech recognition processing is described.
The function of each of the parts 302 to 1307 will be described below. Each of the methods described below can be realized by referring to, for example, the document “Electronic / Information Engineering Introduction Series 2, Sound and Speech Engineering” (Furui, Modern Science Co., Chapter 14).

【0220】音声区間検出部1302は、入力バッファ
キュー1301から入力される音声データのサンプル時
系列について、音声が存在する区間を検出する。より具
体的には、音声区間検出部1302は、所定サンプル
(例えば8kHzサンプリングデータについて32乃至
256サンプル)ずつの平均パワー(電力)を計算し、
その平均パワーが所定の閾値を超えた状態が所定回数以
上連続して続く区間を、音声区間として検出する。これ
により、音声が存在しない区間で文音声が誤認識されて
しまうのを防ぐことができる。
[0220] Voice section detection section 1302 detects a section in which voice exists, in a sample time series of voice data input from input buffer queue 1301. More specifically, the voice section detection unit 1302 calculates an average power (power) of predetermined samples (for example, 32 to 256 samples for 8 kHz sampling data),
A section in which the state in which the average power exceeds a predetermined threshold continues for a predetermined number of times or more is detected as a voice section. Thereby, it is possible to prevent a sentence voice from being erroneously recognized in a section where no voice exists.

【0221】音声分析部1303は、音声区間検出部1
302から出力される音声データについて、その特徴分
析を行うことによって、特徴量パラメータベクトルを検
出する。音声分析方式としては、以下の周知の分析方式
の何れかを採用することができる。 (1)音声データ時系列を入力とする帯域フィルタバン
クの各出力を平滑化し、それらの平滑化された各出力を
特徴量パラメータベクトルの要素とする方式。 (2)連続する所定サンプルずつの音声データ時系列を
入力とする高速フーリエ変換(FFT)によって計算し
た各短時間スペクトル成分を平滑化し、それらの平滑化
された各成分値を特徴量パラメータベクトルの要素とす
る方式。 (3)連続する所定サンプルずつの音声データ時系列を
入力とするケプストラム分析によってケプストラム係数
群を計算し、それらを特徴量パラメータベクトルの要素
とする方式。 (4)上記(3)のケプストラム係数群に加えて、それ
らに対するΔ(デルタ)ケプストラム(ケプストラムの
微係数)群を計算し、それらを特徴量パラメータベクト
ルの要素に加える方式。 (5)連続する所定サンプルずつの音声データ時系列を
入力とする線形予測分析(LPC分析、更に具体的には
線スペクトル対分析:LSP分析)によって、LPC
(LSP)係数群を計算し、それらを特徴量パラメータ
ベクトルの要素とする方式。 (6)連続する所定サンプルずつの音声データ時系列を
入力とする自己相関分析によって自己相関関数を計算
し、それらに基づいて検出される音声のピッチ基本周波
数パターンを特徴量パラメータベクトルの1つの要素に
加える方式。 次に、音素認識部1304は、所定フレーム周期(所定
サンプル)毎に音声分析部1303から出力される特徴
量パラメータベクトルと、音素標準パターン辞書130
5に蓄積されている各音素の特徴量パラメータベクトル
の標準パターンとの類似度(距離)を計算し、その結果
所定フレーム周期毎に得られる類似度の高い音素の組を
その類似度と共に音素ラティスデータとして出力する。
音素認識部1304は、音素の認識誤りの発生を回避す
るために、所定フレーム周期毎に最終的な音素を決定す
ることはせずに、音素候補を表にした音素ラティスデー
タの形式で結果データを出力する。
The voice analysis unit 1303 is provided with the voice section detection unit 1
A feature amount parameter vector is detected by performing a feature analysis on the audio data output from 302. Any of the following well-known analysis methods can be adopted as the voice analysis method. (1) A method of smoothing each output of a band filter bank to which a time series of audio data is input, and using each smoothed output as an element of a feature parameter vector. (2) Smoothing each short-time spectrum component calculated by Fast Fourier Transform (FFT) which receives an audio data time series of a predetermined number of continuous samples as input, and converts each smoothed component value into a feature amount parameter vector. Element method. (3) A method in which a cepstrum coefficient group is calculated by cepstrum analysis using a time series of audio data for each successive predetermined sample as an input, and these are used as elements of a feature parameter vector. (4) A method of calculating a Δ (delta) cepstrum (differential coefficient of a cepstrum) group for the cepstrum coefficient group in addition to the cepstrum coefficient group of the above (3), and adding them to the element of the feature amount parameter vector. (5) LPC analysis is performed by linear prediction analysis (LPC analysis, more specifically, line spectrum pair analysis: LSP analysis) that receives a time series of audio data for each successive predetermined sample as input.
(LSP) A method of calculating coefficient groups and using them as elements of a feature parameter vector. (6) An autocorrelation function is calculated by an autocorrelation analysis using a time series of voice data of each successive predetermined sample as an input, and a pitch fundamental frequency pattern of voice detected based on the autocorrelation function is calculated as one element of a feature parameter vector. Method to add to Next, the phoneme recognizing unit 1304 converts the feature parameter vector output from the speech analyzing unit 1303 for each predetermined frame period (predetermined sample) with the phoneme standard pattern dictionary 1303.
5. The similarity (distance) of the feature parameter vector of each phoneme stored in No. 5 with the standard pattern is calculated, and as a result, a set of phonemes with high similarity obtained at every predetermined frame period is determined along with the phonetic lattice along with the similarity. Output as data.
The phoneme recognizing unit 1304 does not determine the final phoneme at every predetermined frame period in order to avoid occurrence of a phoneme recognition error. Instead, the result data in the form of phoneme lattice data in which phoneme candidates are listed. Is output.

【0222】単語認識部1306は、所定フレーム周期
毎に音素認識部1304から出力される音素ラティスデ
ータを入力として、所定フレーム周期毎に単語候補を表
にして単語ラティスデータを出力する。単語認識方式と
しては、以下の周知の分析方式の何れかを採用すること
ができる。 (1)単語認識部1306は、音素認識部1304から
出力される複数のフレーム周期にまたがる音素ラティス
データの時系列と、単語辞書に蓄積されている全音素標
準パターン系列とで、時間正規化(DPマッチング or
DTW:DynamicTime Warping)を実行し、単語ラティ
スデータを出力する。この場合も、単語認識部1306
は、単語の認識誤りの発声を回避するために、所定フレ
ーム周期毎に最終的な単語を決定することはせずに、単
語候補を表にした単語ラティスデータの形式で結果デー
タを出力する。 (2)単語認識部1306は、HMM(Hidden Markov
Model )によって、全単語をモデル化し、音素認識部1
304から出力される複数のフレーム周期にまたがる音
素ラティスデータの時系列をHMM分析部に入力し、生
起確率の大きいものから複数個のモデルに対応する各単
語を、単語候補である単語ラティスデータとして出力す
る。 最後に、文章認識部1307は、その第1段処理とし
て、単語認識部1306から出力される単語ラティスデ
ータを順次入力し、日本語(英語でもよい)の文節構造
に関する文節内文法(語順規則)に従って、種々の文節
の可能性を文節ラティスデータとして算出する。そし
て、文章認識部1307は、その第2段処理として、文
節間文法に従って文節間の意味的な係り受けを解析し、
認識音声文章データを決定し、それを、入力バッファキ
ュー1301から順次伝達されてきた“端末識別コー
ド”と対について、出力バッファキュー1308に書き
込む。 <検索制御部118の詳細動作>図15は、検索制御部
118の機能ブロック図である。
The word recognizing unit 1306 receives the phoneme lattice data output from the phoneme recognizing unit 1304 at every predetermined frame cycle, and outputs word lattice data with a table of word candidates at every predetermined frame cycle. As the word recognition method, any of the following well-known analysis methods can be adopted. (1) The word recognition unit 1306 performs time normalization on a time series of phoneme lattice data output from the phoneme recognition unit 1304 over a plurality of frame periods and all phoneme standard pattern sequences stored in the word dictionary ( DP matching or
DTW (Dynamic Time Warping) is executed to output word lattice data. Also in this case, the word recognition unit 1306
Outputs the result data in the form of word lattice data in which word candidates are tabulated without determining a final word at every predetermined frame period in order to avoid utterance of a word recognition error. (2) The word recognition unit 1306 uses HMM (Hidden Markov)
Model), all the words are modeled, and the phoneme recognition unit 1
A time series of phoneme lattice data spanning a plurality of frame periods output from 304 is input to the HMM analysis unit, and each word corresponding to a plurality of models from a large occurrence probability is regarded as word lattice data as a word candidate. Output. Finally, the sentence recognizing unit 1307 sequentially inputs the word lattice data output from the word recognizing unit 1306 as a first stage processing, and generates a grammar (phrase order rule) in the bunsetsu regarding the bunsetsu structure of Japanese (or English). , The possibility of various phrases is calculated as phrase lattice data. Then, the sentence recognizing unit 1307 analyzes the semantic dependency between the phrases according to the inter-phrase grammar as the second stage processing,
The recognition voice sentence data is determined, and it is written in the output buffer queue 1308 in combination with the “terminal identification code” sequentially transmitted from the input buffer queue 1301. <Detailed Operation of Search Control Unit 118> FIG. 15 is a functional block diagram of the search control unit 118.

【0223】この検索制御部118は、前述したよう
に、図12に示される処理端末登録テーブルのエントリ
毎に、各エントリから特定される文章バッファファイル
に文音声認識部117によって認識音声文章データが得
られていればそれに対してデータベース検索処理を実行
し、その結果得られる検索結果HTML文章データを上
記各エントリに対応する検索結果バッファファイルに追
加書き込みする。
As described above, the search control unit 118 stores, for each entry in the processing terminal registration table shown in FIG. 12, the sentence speech recognition unit 117 stores the sentence speech sentence data in the sentence buffer file specified from each entry. If it is obtained, a database search process is executed for the search result, and the search result HTML text data obtained as a result is additionally written to the search result buffer file corresponding to each entry.

【0224】上述のエントリ毎の文章バッファファイル
からの認識音声文章データの読出しと検索結果バッファ
ファイルへの検索結果HTML文章データの書込みは、
図15の入出力制御部1507が制御する。まず、この
入出力制御部1507の制御動作につき説明する。図1
6は、入出力制御部1507が実行する制御動作を示す
動作フローチャートである。この動作フローチャート
は、入出力制御部1507を制御する特には図示しない
プロセッサが、特には図示しない制御プログラムを実行
する動作として実現され、前述した、文音声認識部11
7内の図13に示される入出力制御部1309と同様の
制御動作を実現する。
The reading of the recognized speech text data from the text buffer file for each entry and the writing of the search result HTML text data to the search result buffer file are performed as described above.
The input / output control unit 1507 in FIG. First, the control operation of the input / output control unit 1507 will be described. FIG.
6 is an operation flowchart illustrating a control operation performed by the input / output control unit 1507. This operation flowchart is realized as an operation in which a processor (not shown) for controlling the input / output control unit 1507 executes a control program (not shown).
7 realizes the same control operation as the input / output control unit 1309 shown in FIG.

【0225】まず、ステップ1601では、処理端末登
録テーブル(図12)において、文章バッファファイル
名に対応する文章バッファファイルに認識音声文章デー
タが記憶されているエントリが存在するか否かが判定さ
れる。
First, in step 1601, it is determined whether or not there is an entry in the processing terminal registration table (FIG. 12) in which the recognized speech text data is stored in the text buffer file corresponding to the text buffer file name. .

【0226】そのようなエントリが存在しステップ16
01の判定がYESならば、ステップ1602で、該当
するエントリ毎に、そのエントリに記憶されている“端
末識別コード”と、そのエントリに記憶されている文章
バッファファイル名に対応する文章バッファファイル上
の認識音声文章データとが、図15の入力バッファキュ
ー1501に書き込まれ、その認識音声文章データが文
章バッファファイルから削除される。
If such an entry exists and step 16
If the determination of 01 is YES, in step 1602, for each entry, the "terminal identification code" stored in the entry and the text buffer file name corresponding to the text buffer file name stored in the entry are displayed. Is written into the input buffer queue 1501 in FIG. 15, and the recognized voice sentence data is deleted from the text buffer file.

【0227】入力バッファキュー1501は、それがキ
ューイングしている認識音声文章データを、検索インデ
ックス作成部1502に順次流し込む機能を有する。検
索インデックス作成部1502以降に接続されている検
索キーワード抽出部1503及び検索実行部1505
は、図13に示される文音声認識部117の構成の場合
と同様に、データ処理パイプラインを形成しており、相
互に独立して、入力データを処理する機能を有する。ま
た、1502〜1505の各部分は、現在処理している
認識音声文章データに対応する“端末識別コード”(入
力バッファキュー1501から入力される)を認識する
ことができる。従って、最終的に検索実行部1505か
ら出力バッファキュー1506へは、“端末識別コー
ド”と検索結果HTML文章データとの組が出力される
ことになる。
The input buffer queue 1501 has a function of sequentially flowing the recognition voice sentence data queued therein to the search index creation unit 1502. A search keyword extraction unit 1503 and a search execution unit 1505 connected after the search index creation unit 1502
Forms a data processing pipeline similarly to the configuration of the sentence speech recognition unit 117 shown in FIG. 13, and has a function of processing input data independently of each other. Each of the parts 1502 to 1505 can recognize the “terminal identification code” (input from the input buffer queue 1501) corresponding to the currently recognized speech text data. Therefore, finally, a set of the “terminal identification code” and the search result HTML text data is output from the search execution unit 1505 to the output buffer queue 1506.

【0228】ステップ1602の処理の後又はステップ
1601の判定がNOの場合には、ステップ1603
で、図15の出力バッファキュー1506に、“端末識
別コード”と検索結果HTML文章データの組が得られ
ているか否かが判定される。
After the processing in step 1602 or when the determination in step 1601 is NO, step 1603
Then, it is determined whether a set of “terminal identification code” and search result HTML text data is obtained in the output buffer queue 1506 in FIG.

【0229】そのような組が得られておりステップ16
03の判定がYESならば、ステップ1604で、出力
バッファキュー1506内の組毎に、その組の“端末識
別コード”に対応する処理端末登録テーブルのエントリ
について、そのエントリに記憶されている検索結果バッ
ファファイル名に対応する検索結果バッファファイル
に、出力バッファキュー1506内の組の検索結果HT
ML文章データが追加書き込みされる。
When such a set is obtained, step 16
If the determination in step 03 is YES, in step 1604, for each set in the output buffer queue 1506, for the entry in the processing terminal registration table corresponding to the "terminal identification code" of that set, the search result stored in that entry A set of search results HT in the output buffer queue 1506 is stored in the search result buffer file corresponding to the buffer file name.
ML text data is additionally written.

【0230】ステップ1604の処理の後又はステップ
1603の判定がNOの場合には、再びステップ160
1の判定処理が実行される。以上のようにして検索制御
部118は、文音声認識部117の場合と同様に、流れ
作業的に効率良く、複数の移動端末101からの要求に
基づいて文音声認識部117において得られた認識音声
文章データに対するデータベース検索処理を実行するこ
とができる。
After the processing in step 1604 or when the determination in step 1603 is NO, step 160
1 is performed. As described above, similarly to the case of the sentence speech recognition unit 117, the search control unit 118 efficiently performs the workflow and recognizes the recognition obtained by the sentence speech recognition unit 117 based on the requests from the plurality of mobile terminals 101. It is possible to execute a database search process for voice sentence data.

【0231】次に、データベース検索処理を実現するた
めの1502〜1505の各部分の機能につき、以下に
説明する。検索インデックス作成部1502は、入力バ
ッファキュー1401から順次入力される“端末識別コ
ード”と認識音声文章データとの組のそれぞれについ
て、その組の“端末識別コード”に対応する処理端末登
録テーブルのエントリに記憶されている検索インデック
スバッファファイル名から得られる検索インデックスバ
ッファファイルを使用しながら、移動端末101別に認
識音声文章データを構成する単語を一定の基準に従って
分類したリストである検索インデックスを作成し、それ
を上記組の“端末識別コード”と共に検索キーワード抽
出部1503に出力する。具体的には、検索インデック
ス作成部1502は、例えば、その組の認識音声文章デ
ータを構成する例えば図18に示されるような各単語の
出現回数をカウントすることにより、出現回数の大きい
順にリスト化された単語表である検索インデックスを例
えば図19に示されるように作成する。この場合、検索
インデックスバッファファイルには、1つの移動端末1
01から文音声認識/データベース検索処理の開始要求
コマンドが指定された以後の検索インデックスが蓄積さ
れており、その検索インデックスと今回入力された認識
音声文章データを構成する各単語とに基づいて、新たな
検索インデックスが作成され、それが検索インデックス
バッファファイルに蓄積される。このため、上記コマン
ドの指定以後に1つの移動端末101から入力された音
声に現れる単語が、一定の基準で、即ち例えば出現回数
の多い順で、検索インデックス上でリスト化されること
になる。なお、認識音声文章データには、例えば図18
の“*”として示されるように単語の区切り情報が含ま
れる。この単語の区切り情報は、文章バッファファイル
及び入力バッファキュー1501を介して、文音声認識
部117内の文章認識部1407から引き渡されるた
め、認識音声文章データ上での各単語の区切りは容易に
識別できる。
Next, the function of each of the parts 1502 to 1505 for realizing the database search processing will be described below. For each set of the “terminal identification code” and the recognized speech text data that are sequentially input from the input buffer queue 1401, the search index creation unit 1502 creates an entry in the processing terminal registration table corresponding to the “terminal identification code” of the set. The search index buffer file obtained from the search index buffer file name stored in is used to create a search index, which is a list in which words constituting the recognized speech text data are classified for each mobile terminal 101 according to a predetermined criterion, It is output to the search keyword extraction unit 1503 together with the above-mentioned “terminal identification code”. More specifically, for example, the search index creation unit 1502 counts the number of appearances of each of the words constituting the set of recognized speech text data as shown in FIG. A search index, which is a word table obtained, is created, for example, as shown in FIG. In this case, one mobile terminal 1 is stored in the search index buffer file.
From 01, a search index after the command for starting the sentence speech recognition / database search process is designated is accumulated, and a new search index is stored on the basis of the search index and each word constituting the currently-recognized speech sentence data. A search index is created and stored in a search index buffer file. Therefore, words appearing in the voice input from one mobile terminal 101 after the designation of the command are listed on the search index according to a certain standard, that is, for example, in descending order of the number of appearances. Note that the recognized voice sentence data includes, for example, FIG.
The word delimiter information is included as indicated by “*”. Since the word delimiter information is passed from the text recognition unit 1407 in the text and speech recognition unit 117 via the text buffer file and the input buffer queue 1501, the delimitation of each word on the recognized voice text data is easily identified. it can.

【0232】次に、検索キーワード抽出部1503は、
検索インデックス作成部1502から出力される“端末
識別コード”と検索インデックスとの組のそれぞれにつ
き、その組の検索インデックス中で所定の基準を満たす
単語、例えば出現回数が一定回数以上の(又は一定の出
現回数順位以上の順位の)単語を抽出する。更に、検索
キーワード抽出部1503は、抽出された単語のうち、
不要キーワード辞書1504に登録されていない単語を
抽出し、更に、上記検索インデックスと共に検索インデ
ックス作成部1502から出力されている“端末識別コ
ード”に対応する処理端末登録テーブルのエントリに記
憶されている検索済キーワードバッファファイル名から
得られる検索済キーワードバッファファイルに登録され
ている検索済キーワード以外の単語を抽出し、それを検
索キーワードとして上記組の“端末識別コード”と共に
出力する。また、検索キーワード抽出部1503は、そ
の検索キーワードを、上記検索済キーワードバッファフ
ァイルに登録する。
Next, the search keyword extraction unit 1503
For each set of the “terminal identification code” and the search index output from the search index creation unit 1502, a word that satisfies a predetermined criterion in the search index of the set, for example, the number of occurrences of which is equal to or more than a certain number (or a certain number) Extract words whose rank is equal to or higher than the rank of appearance frequency. Further, the search keyword extracting unit 1503 selects, among the extracted words,
A word that is not registered in the unnecessary keyword dictionary 1504 is extracted, and a search stored in an entry of the processing terminal registration table corresponding to the “terminal identification code” output from the search index creation unit 1502 together with the search index. Then, a word other than the searched keyword registered in the searched keyword buffer file obtained from the searched keyword buffer file name is extracted, and the extracted word is output as a search keyword together with the “terminal identification code” of the above set. The search keyword extraction unit 1503 registers the search keyword in the searched keyword buffer file.

【0233】不要キーワード辞書1504には、普通動
詞、形容詞、副詞、助動詞、助詞、接続詞、前置詞等の
単語が登録されている。この辞書が参照されることによ
り、無意味な単語がデータベース検索処理されることを
回避することができ、移動端末101に対して有意な検
索結果HTML文章データのみを提供することができ
る。
In the unnecessary keyword dictionary 1504, words such as ordinary verbs, adjectives, adverbs, auxiliary verbs, particles, conjunctions, and prepositions are registered. By referring to this dictionary, meaningless words can be prevented from being searched in the database, and only significant search result HTML text data can be provided to the mobile terminal 101.

【0234】また、検索済キーワードバッファファイル
には、1つの移動端末101から文音声認識/データベ
ース検索処理の開始要求コマンドが指定された以後にデ
ータベース検索処理された検索キーワードが登録されて
いる。このファイルが参照されることにより、同じ検索
キーワードが重複してデータベース検索処理されること
を回避することができる。
[0234] In the searched keyword buffer file, search keywords that have been subjected to database search processing after one mobile terminal 101 has specified a sentence speech recognition / database search processing start request command are registered. By referring to this file, it is possible to prevent the same search keyword from being subjected to database search processing redundantly.

【0235】検索実行部1505は、検索キーワード抽
出部1503から出力される“端末識別コード”と検索
キーワードの組のそれぞれについて、その組の検索キー
ワードを用いて、インターネット105上の予め登録さ
れている特定のデータベース検索エンジンに対して、問
合せを依頼する。この場合、複数検索キーワードが例え
ばアンド結合又はオア結合されることによって問合せデ
ータが作成される。そして、この問合せデータは、上述
のデータベース検索エンジンが存在するインターネット
105に接続されるホスト装置上のWebサーバに対す
るHTTPの通信プロトコルに基づく要求データとし
て、TCP/IPパケットに格納されパケット送受信部
115(図1)を介して送信される。その結果、検索制
御部118は、インターネット105上の上記ホスト装
置からルータ装置106、LAN107、及びパケット
送受信部115(図1)を介して返される検索結果に基
づいて、図20に示されるような検索結果HTML文章
データを生成し、それを上記組の“端末識別コード”と
共に出力バッファキュー1408に書き込む。 <他の実施の形態>以上説明した実施の形態では、移動
端末101は、PHS端末であって、移動端末101と
音声制御ホスト装置108とは、PHS網103とイン
ターネット105を介して接続されている。しかし、本
発明は、これに限られるものではなく、無線又は有線に
よって間接的又は直接的に音声制御ホスト装置108に
接続される形態であれば、どのような形態であっても本
発明をそれに適用することができる。
The search execution unit 1505 is registered in advance on the Internet 105 for each set of the “terminal identification code” and the search keyword output from the search keyword extraction unit 1503, using the set search keyword. Request a query from a specific database search engine. In this case, the inquiry data is created by, for example, AND-joining or OR-joining the plurality of search keywords. The inquiry data is stored in a TCP / IP packet as request data based on an HTTP communication protocol for a Web server on a host device connected to the Internet 105 where the above-described database search engine exists, and is stored in the packet transmission / reception unit 115 ( 1). As a result, based on the search result returned from the host device on the Internet 105 via the router device 106, the LAN 107, and the packet transmission / reception unit 115 (FIG. 1), the search control unit 118 as shown in FIG. The search result HTML text data is generated and written to the output buffer queue 1408 together with the above-mentioned “terminal identification code”. <Other Embodiments> In the embodiment described above, mobile terminal 101 is a PHS terminal, and mobile terminal 101 and voice control host device 108 are connected via PHS network 103 and Internet 105. I have. However, the present invention is not limited to this, and the present invention may be applied to any form connected to the voice control host device 108 indirectly or directly by wireless or wired. Can be applied.

【0236】また、本実施の形態では、検索制御部11
8によって検索されるデータベース検索エンジンは、イ
ンターネット105に接続されるホスト装置上のWeb
サーバが管理するものであるが、本発明はこれに限られ
るものではなく、例えば音声制御ホスト装置108内又
はLAN107に接続される他のホスト装置内に検索キ
ーワードに対するホームページ情報を格納したローカル
なデータベースを構築し、検索制御部118はそれにア
クセスして検索結果を得るように構成されてもよい。
In this embodiment, the search control unit 11
The database search engine searched by the Web server 8 is a Web search engine on a host device connected to the Internet 105.
Although managed by the server, the present invention is not limited to this. For example, a local database storing home page information for a search keyword in the voice control host device 108 or another host device connected to the LAN 107 And the search control unit 118 may be configured to access it and obtain search results.

【0237】[0237]

【発明の効果】本発明によれば、移動端末は、高度な音
声認識/データベース検索/リソースアクセス環境を設
備する必要がなく実用的な精度を有する音声認識/デー
タベース検索機能の提供を低コストで受けることが可能
となる。
According to the present invention, a mobile terminal can provide a speech recognition / database search function having practical accuracy without providing a sophisticated speech recognition / database search / resource access environment at a low cost. It is possible to receive.

【0238】また、本発明によれば、現在全国的及び全
世界的に普及しつつあるパーソナルハンディホンシステ
ム通信網及びインターネットを経由することにより、実
用的な精度を有する音声認識機能と、ワールドワイドな
データベース検索、及びその検索結果に対応するリソー
スへのアクセス機能の提供を、より低コスト及び手軽に
受けることができると同時に、本発明が提供する機能と
パーソナルハンディホンシステム通話機能及びインター
ネットアクセス機能とを、シームレスに結合することが
可能となる。
Further, according to the present invention, by using a personal handyphone system communication network and the Internet, which are currently spreading nationwide and worldwide, a speech recognition function having practical accuracy and a world wide A simple database search and a function of accessing a resource corresponding to the search result can be provided at a lower cost and easily, and at the same time, a function provided by the present invention, a call function of a personal handyphone system, and an Internet access function Can be seamlessly combined.

【0239】更に、本発明によれば、移動端末と音声制
御ホスト装置とを全世界的に容易に特定できると共に、
音声認識/データベース検索処理サービスと、その検索
結果に基づくリソースへのアクセスサービス、及びその
他の情報処理サービスとの共存を容易に実現することが
可能となる。
Further, according to the present invention, a mobile terminal and a voice control host device can be easily specified worldwide,
It is possible to easily realize a speech recognition / database search processing service, a resource access service based on the search result, and other information processing services.

【0240】加えて、本発明によれば、ホスト装置側の
負荷分散を容易に実現することが可能となる。
In addition, according to the present invention, it is possible to easily realize load distribution on the host device side.

【図面の簡単な説明】[Brief description of the drawings]

【図1】全システム構成図である。FIG. 1 is an overall system configuration diagram.

【図2】移動端末の外観図である。FIG. 2 is an external view of a mobile terminal.

【図3】移動端末の機能ブロック図である。FIG. 3 is a functional block diagram of a mobile terminal.

【図4】移動端末の処理の全体動作フローチャートであ
る。
FIG. 4 is an overall operation flowchart of processing of a mobile terminal.

【図5】送信処理の動作フローチャートである。FIG. 5 is an operation flowchart of a transmission process.

【図6】通信データのフォーマット図である。FIG. 6 is a format diagram of communication data.

【図7】IPヘッダとTCPヘッダのフォーマット図で
ある。
FIG. 7 is a format diagram of an IP header and a TCP header.

【図8】PPPを用いた発信処理の動作フローチャート
である。
FIG. 8 is an operation flowchart of a calling process using PPP.

【図9】移動端末通信制御部の動作フローチャート(そ
の1)である。
FIG. 9 is an operation flowchart (part 1) of a mobile terminal communication control unit.

【図10】移動端末通信制御部の動作フローチャート
(その2)である。
FIG. 10 is an operation flowchart (part 2) of the mobile terminal communication control unit.

【図11】移動端末通信制御部の動作フローチャート
(その3)である。
FIG. 11 is an operation flowchart (part 3) of the mobile terminal communication control unit.

【図12】処理端末登録テーブルのデータ構成図であ
る。
FIG. 12 is a data configuration diagram of a processing terminal registration table.

【図13】文音声認識部の構成図である。FIG. 13 is a configuration diagram of a sentence speech recognition unit.

【図14】文音声認識部内の入出力制御部の動作フロー
チャートである。
FIG. 14 is an operation flowchart of an input / output control unit in the sentence speech recognition unit.

【図15】検索制御部の構成図である。FIG. 15 is a configuration diagram of a search control unit.

【図16】検索制御部内の入出力制御部の動作フローチ
ャートである。
FIG. 16 is an operation flowchart of an input / output control unit in the search control unit.

【図17】PHS会話内容の例を示す図である。FIG. 17 is a diagram illustrating an example of PHS conversation content.

【図18】認識音声文章データの例を示す図である。FIG. 18 is a diagram illustrating an example of recognized speech sentence data.

【図19】検索インデックスの例を示す図である。FIG. 19 is a diagram illustrating an example of a search index.

【図20】検索結果HTML文章データの例を示す図で
ある。
FIG. 20 is a diagram illustrating an example of search result HTML text data.

【図21】検索結果HTML文章データの表示画面例を
示す図である。
FIG. 21 is a diagram illustrating a display screen example of search result HTML text data.

【図22】ハイパーリンク先のホームページの表示画面
例(その1)を示す図である。
FIG. 22 is a diagram showing an example (part 1) of a display screen of a homepage at a hyperlink destination.

【図23】ハイパーリンク先のホームページの表示画面
例(その2)を示す図である。
FIG. 23 is a diagram showing an example (part 2) of a display screen of a homepage at a hyperlink destination.

【符号の説明】[Explanation of symbols]

101 移動端末 102 無線基地(有線接続装置) 103 PHS網(公衆電話網、ISDN網) 104 移動端末制御ホスト装置 105 インターネット 106 ルータ装置 107 LAN(ローカルエリアネットワーク) 108 音声制御ホスト装置 109 入力部 110 制御部 111 通信部 112 出力部 113 接続確立部 114 ルーティング部 115 パケット送受信部 116 移動端末通信制御部 117 文音声認識部 118 検索制御部 201、301 マイク 202、304 カメラ(CCDカメラ) 203、311 LCD表示部 204、308 スピーカ 205、323 無線アンテナ 206、325 ソケット(通信用) 207 ICカードスロット 208 光送受信機(光通信用) 302、305 A/D変換部 303 マイク制御部 306、313 メモリ 307 カメラ制御部 309 D/A変換部 310 スピーカ制御部 312 LCDドライバ 314 LCD制御部 315 タッチパネル制御部 316 CPU 317 RAM 318 ROM 319 ICカードインタフェース部 320 ICカード 321 通信制御部 322 無線ドライバ 324 有線ドライバ 1401、1501 入力バッファキュー 1402 音声区間検出部 1403 音声分析部 1404 音素認識部 1405 音素標準パターン辞書 1406 単語認識部 1407 文章認識部 1408、1506 出力バッファキュー 1409、1507 入出力制御部 1502 検索インデックス作成部 1503 検索キーワード抽出部 1504 不要キーワード辞書 1505 検索実行部 Reference Signs List 101 mobile terminal 102 wireless base (wired connection device) 103 PHS network (public telephone network, ISDN network) 104 mobile terminal control host device 105 internet 106 router device 107 LAN (local area network) 108 voice control host device 109 input unit 110 control Unit 111 communication unit 112 output unit 113 connection establishment unit 114 routing unit 115 packet transmission / reception unit 116 mobile terminal communication control unit 117 sentence speech recognition unit 118 search control unit 201, 301 microphone 202, 304 camera (CCD camera) 203, 311 LCD display Units 204, 308 Speakers 205, 323 Wireless antenna 206, 325 Socket (for communication) 207 IC card slot 208 Optical transceiver (for optical communication) 302, 305 A / D conversion unit 303 Microphone Control unit 306, 313 memory 307 Camera control unit 309 D / A conversion unit 310 Speaker control unit 312 LCD driver 314 LCD control unit 315 Touch panel control unit 316 CPU 317 RAM 318 ROM 319 IC card interface unit 320 IC card 321 Communication control unit 322 Wireless driver 324 Wired driver 1401, 1501 Input buffer queue 1402 Voice section detection unit 1403 Voice analysis unit 1404 Phoneme recognition unit 1405 Phoneme standard pattern dictionary 1406 Word recognition unit 1407 Text recognition unit 1408, 1506 Output buffer queue 1409, 1507 Input / output control unit 1502 search index creation unit 1503 search keyword extraction unit 1504 unnecessary keyword dictionary 1505 search execution unit

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04M 11/08 H04B 7/26 109M ──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 6 Identification code FI H04M 11/08 H04B 7/26 109M

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 移動端末がホスト装置と通信する通信シ
ステムであって、 前記移動端末内に、 無線網又は有線網の何れか一方又は両方から構成される
中継網を介して間接的に又は該中継網を介さずに直接的
に前記ホスト装置である音声制御ホスト装置に接続する
ホスト接続手段と、 音声を入力する音声入力手段と、 前記ホスト接続手段による接続動作の後、前記音声入力
手段から入力される音声データを前記音声制御ホスト装
置に送信する音声データ送信手段と、 前記音声制御ホスト装置から返信されハイパーテキスト
マークアップ言語HTMLによって記述された検索結果
HTML文章データを受信する検索結果HTML文章デ
ータ受信手段と、 該受信された検索結果HTML文章データを表示及び処
理する検索結果HTML文章データ表示/処理手段と、 該表示される検索結果HTML文章データに含まれかつ
ユーザが指定したアクセス情報に対応するホスト装置上
のリソースに、前記中継網を介して間接的に又は該中継
網を介さずに直接的にアクセスして、該リソースを処理
するリソースアクセス処理手段と、 を含み、 前記音声制御ホスト装置内に、 前記移動端末内のホスト接続手段による接続動作に応答
して、前記移動端末を識別して接続する移動端末接続手
段と、 現在接続されている移動端末毎に、前記音声データを受
信する音声データ受信手段と、 現在接続されている移動端末毎に、前記音声データ受信
手段により受信された音声データに対して音声認識処理
を実行する音声認識手段と、 現在接続されている移動端末毎に、前記音声認識手段に
よる音声認識処理によって得られる認識音声データから
検索キーワードを抽出し、該検索キーワードに対応する
リソースに対する前記アクセス情報を含む前記検索結果
HTML文章データを所定のデータベースシステムから
検索する検索制御手段と、 現在接続されている移動端末毎に、前記検索制御手段に
よる検索処理によって得られる検索結果HTML文章デ
ータを、それに対応する移動端末に返信する検索結果H
TML文章データ返信手段と、 を含む、 ことを特徴とする移動端末音声認識/データベース検索
/リソースアクセス通信システム。
1. A communication system in which a mobile terminal communicates with a host device, wherein the mobile terminal indirectly or via a relay network comprising one or both of a wireless network and a wired network. A host connecting means for directly connecting to the voice control host device, which is the host device, without going through a relay network; a voice input means for inputting voice; and a connection operation by the host connecting means, after the voice input means, Voice data transmission means for transmitting input voice data to the voice control host device; and search result HTML text returned from the voice control host device and receiving search result HTML text data described in hypertext markup language HTML. Data receiving means, and search result HTML text data for displaying and processing the received search result HTML text data Display / processing means, indirectly via the relay network or via the relay network to resources on the host device which are included in the displayed search result HTML text data and correspond to the access information specified by the user. Resource access processing means for directly accessing the mobile terminal without processing the resource, in the voice control host device, in response to a connection operation by a host connection means in the mobile terminal, Mobile terminal connection means for identifying and connecting to each other, voice data receiving means for receiving the voice data for each currently connected mobile terminal, and voice data receiving means for each currently connected mobile terminal. Voice recognition means for performing voice recognition processing on received voice data, and voice recognition processing by the voice recognition means for each currently connected mobile terminal. Search control means for extracting a search keyword from the recognized voice data obtained by the search and searching the search result HTML text data including the access information for the resource corresponding to the search keyword from a predetermined database system; For each mobile terminal, the search result HTML text data obtained by the search processing by the search control means is returned to the corresponding mobile terminal by the search result H.
A mobile terminal voice recognition / database search / resource access communication system, comprising: TML text data return means.
【請求項2】 移動端末がホスト装置と通信する通信シ
ステムに使用される前記移動端末であって、 無線網又は有線網の何れか一方又は両方から構成される
中継網を介して間接的に又は該中継網を介さずに直接的
に前記ホスト装置である音声制御ホスト装置に接続する
ホスト接続手段と、 音声を入力する音声入力手段と、 前記ホスト接続手段による接続動作の後、前記音声入力
手段から入力される音声データを前記音声制御ホスト装
置に送信する音声データ送信手段と、 前記音声制御ホスト装置から返信されハイパーテキスト
マークアップ言語HTMLによって記述された検索結果
HTML文章データを受信する検索結果HTML文章デ
ータ受信手段と、 該受信された検索結果HTML文章データを表示及び処
理する検索結果HTML文章データ表示/処理手段と、 該表示される検索結果HTML文章データに含まれかつ
ユーザが指定したアクセス情報に対応するホスト装置上
のリソースに、前記中継網を介して間接的に又は該中継
網を介さずに直接的にアクセスして、該リソースを処理
するリソースアクセス処理手段と、 を含むことを特徴とする移動端末。
2. The mobile terminal used in a communication system in which the mobile terminal communicates with a host device, wherein the mobile terminal is indirectly or via a relay network including one or both of a wireless network and a wired network. Host connection means for directly connecting to the audio control host device which is the host device without passing through the relay network; voice input means for inputting voice; and after the connection operation by the host connection means, the voice input means Voice data transmitting means for transmitting voice data input from the voice control host device to the voice control host device; and search result HTML for receiving search result HTML text data returned from the voice control host device and described in hypertext markup language HTML Sentence data receiving means, and a search result HTML sentence for displaying and processing the received search result HTML sentence data Data display / processing means, and indirectly via the relay network or the relay network to resources on the host device included in the displayed search result HTML text data and corresponding to the access information specified by the user. And a resource access processing means for directly accessing the resource without using the resource and processing the resource.
【請求項3】 移動端末がホスト装置と通信する通信シ
ステムに使用される前記ホスト装置であって、 無線網又は有線網の何れか一方又は両方から構成される
中継網を介して間接的に又は該中継網を介さずに直接的
に前記移動端末が実行する接続動作に応答して、前記移
動端末を識別して接続する移動端末接続手段と、 現在接続されている移動端末毎に、音声データを受信す
る音声データ受信手段と、 現在接続されている移動端末毎に、前記音声データ受信
手段により受信された音声データに対して音声認識処理
を実行する音声認識手段と、 現在接続されている移動端末毎に、前記音声認識手段に
よる音声認識処理によって得られる認識音声データから
検索キーワードを抽出し、該検索キーワードに対応する
リソースに対するアクセス情報を含みハイパーテキスト
マークアップ言語HTMLによって記述された検索結果
HTML文章データを所定のデータベースシステムから
検索する検索制御手段と、 現在接続されている移動端末毎に、前記検索制御手段に
よる検索処理によって得られる検索結果HTML文章デ
ータを、それに対応する移動端末に返信する検索結果H
TML文章データ返信手段と、 を含むことを特徴とする音声制御ホスト装置。
3. The host device used in a communication system in which a mobile terminal communicates with a host device, wherein the host device is indirectly or via a relay network including one or both of a wireless network and a wired network. Mobile terminal connection means for identifying and connecting to the mobile terminal in response to a connection operation performed by the mobile terminal directly without passing through the relay network; and voice data for each currently connected mobile terminal. Voice data receiving means for receiving voice data, voice recognition means for performing voice recognition processing on voice data received by the voice data receiving means, for each currently connected mobile terminal, For each terminal, a search keyword is extracted from recognition voice data obtained by voice recognition processing by the voice recognition means, and access information for a resource corresponding to the search keyword is extracted. Search control means for searching a predetermined database system for search result HTML text data described in a hypertext markup language HTML, and a search obtained by the search processing by the search control means for each currently connected mobile terminal. A search result H which returns the result HTML text data to the corresponding mobile terminal.
A voice control host device comprising: a TML text data returning means.
【請求項4】 前記移動端末は、パーソナルハンディホ
ンシステム通信機能を備え、 前記中継網は、パーソナルハンディホンシステム通信網
とインターネットを含み、 前記音声制御ホスト装置及び前記アクセス情報に対応す
るホスト装置は、前記インターネットに接続し、 前記移動端末内のホスト接続手段又はリソースアクセス
処理手段は、前記パーソナルハンディホンシステム通信
網を介して、該パーソナルハンディホンシステム通信網
を含む公衆網と前記インターネットとの間のゲートウエ
イ機能を有する移動端末制御ホスト装置に発信し接続す
ることによって、前記インターネット上の通信プロトコ
ルを使用して、前記移動端末制御ホスト装置から前記イ
ンターネットを介して前記音声制御ホスト装置又は前記
アクセス情報に対応するホスト装置に接続又はアクセス
する、 ことを特徴とする請求項1乃至3の何れか1項に記載の
移動端末音声認識/データベース検索/リソースアクセ
ス通信システム、移動端末、又は音声制御ホスト装置。
4. The mobile terminal has a personal handyphone system communication function, the relay network includes a personal handyphone system communication network and the Internet, and the voice control host device and the host device corresponding to the access information are: Connecting to the Internet, the host connection means or the resource access processing means in the mobile terminal, via the personal handyphone system communication network, between the public network including the personal handyphone system communication network and the Internet The voice control host device or the access information is transmitted from the mobile terminal control host device via the Internet using the communication protocol on the Internet by transmitting and connecting to the mobile terminal control host device having a gateway function of Corresponding to The mobile terminal voice recognition / database search / resource access communication system, mobile terminal, or voice control host device according to any one of claims 1 to 3, wherein the mobile terminal is connected or accessed to a host device.
【請求項5】 前記ホスト接続手段が使用する通信プロ
トコルは、インターネットプロトコル層及びトランスミ
ッションコントロールプロトコル層を含む階層プロトコ
ルであって、 前記インターネット上を伝送される前記インターネット
プロトコル層のパケットデータであるインターネットプ
ロトコルデータグラムのヘッダフィールドには、前記イ
ンターネット上での前記移動端末及び前記音声制御ホス
ト装置のアドレスを指定する送信元インターネットプロ
トコルアドレス及び宛先インターネットプロトコルアド
レスが格納され、該インターネットプロトコルデータグ
ラムのデータフィールドには、前記トランスミッション
コントロールプロトコル層のパケットデータであるトラ
ンスミッションコントロールプロトコルセグメントが格
納され、 前記トランスミッションコントロールプロトコルセグメ
ントのヘッダフィールドには、前記音声認識/データベ
ース検索処理のための通信プロトコルを特定する送信元
ポート番号及び宛先ポート番号が格納され、該トランス
ミッションコントロールプロトコルセグメントのデータ
フィールドには、前記移動端末を識別するための端末識
別コード、前記音声データ、又は前記検索結果HTML
文章データが格納される、 ことを特徴とする請求項4に記載の移動端末音声認識/
データベース検索/リソースアクセス通信システム、移
動端末、又は音声制御ホスト装置。
5. The communication protocol used by the host connection means is a hierarchical protocol including an Internet protocol layer and a transmission control protocol layer, and the Internet protocol is packet data of the Internet protocol layer transmitted on the Internet. In the header field of the datagram, a source Internet protocol address and a destination Internet protocol address that specify the addresses of the mobile terminal and the voice control host device on the Internet are stored, and in the data field of the Internet protocol datagram, Stores a transmission control protocol segment which is packet data of the transmission control protocol layer. In the header field of the transmission control protocol segment, a source port number and a destination port number that specify a communication protocol for the voice recognition / database search processing are stored. In a data field of the transmission control protocol segment, A terminal identification code for identifying the mobile terminal, the voice data, or the search result HTML
The mobile terminal voice recognition / communication according to claim 4, wherein text data is stored.
Database search / resource access communication system, mobile terminal, or voice control host device.
【請求項6】 前記音声制御ホスト装置は、網によって
相互に接続され、前記移動端末接続手段、前記音声デー
タ受信手段、前記音声認識手段、前記データベース手
段、前記検索制御手段、及び前記検索結果HTML文章
データ返信手段に対応する機能を分散して実現する複数
のホストコンピュータから構成される、 ことを特徴とする請求項1、又は3乃至5の何れか1項
に記載の移動端末音声認識/データベース検索/リソー
スアクセス通信システム又は音声制御ホスト装置。
6. The voice control host device is mutually connected by a network, and the mobile terminal connection means, the voice data receiving means, the voice recognition means, the database means, the search control means, and the search result HTML. The mobile terminal voice recognition / database according to any one of claims 1 to 3, further comprising a plurality of host computers that realize functions distributed to the sentence data return means in a distributed manner. Search / resource access communication system or voice control host device.
【請求項7】 前記検索制御手段は、 現在接続されている移動端末毎に、前記音声認識手段に
よる音声認識処理によって得られる認識音声データを所
定の分類規則に従って分類することにより、検索インデ
ックスを作成する検索インデックス作成手段と、 現在接続されている移動端末毎に、前記検索インデック
ス作成手段により作成される検索インデックスから所定
の抽出基準を満たす語句を抽出し、該抽出された語句か
ら所定の不要キーワードを除去し、その結果得られる語
句のうち新規のものを検索キーワードとして抽出する検
索キーワード抽出手段と、 該検索キーワードに対応する検索結果HTML文章デー
タを前記所定のデータベースシステムから検索する検索
実行手段と、 を含むことを特徴とする請求項1、又は3乃至6の何れ
か1項に記載の移動端末音声認識/データベース検索/
リソースアクセス通信システム又は音声制御ホスト装
置。
7. The search control unit creates a search index by classifying recognized speech data obtained by speech recognition processing by the speech recognition unit according to a predetermined classification rule for each of currently connected mobile terminals. A search index creating unit that extracts a phrase that satisfies a predetermined extraction criterion from a search index created by the search index creation unit for each currently connected mobile terminal, and extracts a predetermined unnecessary keyword from the extracted phrase. Search keyword extracting means for extracting a new one of the resulting phrases as a search keyword, and search executing means for searching the predetermined database system for search result HTML text data corresponding to the search keyword. 7. The method according to claim 1, further comprising: Mobile device voice recognition according to one of claims / database search /
Resource access communication system or voice control host device.
【請求項8】 前記検索インデックス作成手段は、入力
されたデータ中に現れる各単語を、出現回数の多い順に
分類することにより、前記検索インデックスを作成し、 前記検索キーワード抽出手段は、前記検索インデックス
から、出現回数が所定回数以上の単語又は所定の出現回
数順位以上の順位の単語を抽出し、該抽出された語句か
ら所定の不要キーワードを除去し、その結果得られる語
句のうち新規のものを検索キーワードとして抽出するこ
とを特徴とする請求項7に記載の移動端末音声認識/デ
ータベース検索/リソースアクセス通信システム又は音
声制御ホスト装置。
8. The search index creating means creates the search index by classifying each word appearing in the input data in the order of the number of appearances, and the search keyword extracting means includes: A word whose appearance number is equal to or more than a predetermined number or a word whose rank is equal to or more than a predetermined appearance number rank, removes a predetermined unnecessary keyword from the extracted words, and replaces a new word among the words obtained as a result. 8. The mobile terminal voice recognition / database search / resource access communication system or voice control host device according to claim 7, wherein the voice terminal is extracted as a search keyword.
【請求項9】 前記所定のデータベースシステムは、前
記インターネットに接続される所定のホスト装置が提供
する、 ことを特徴とする請求項4に記載の移動端末音声認識/
データベース検索/リソースアクセス通信システム又は
音声制御ホスト装置。
9. The mobile terminal according to claim 4, wherein the predetermined database system is provided by a predetermined host device connected to the Internet.
Database search / resource access communication system or voice control host device.
JP8285086A 1996-10-28 1996-10-28 Mobile terminal system for voice recognition, database search, and resource access communications Pending JPH10133847A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8285086A JPH10133847A (en) 1996-10-28 1996-10-28 Mobile terminal system for voice recognition, database search, and resource access communications

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8285086A JPH10133847A (en) 1996-10-28 1996-10-28 Mobile terminal system for voice recognition, database search, and resource access communications

Publications (1)

Publication Number Publication Date
JPH10133847A true JPH10133847A (en) 1998-05-22

Family

ID=17686964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8285086A Pending JPH10133847A (en) 1996-10-28 1996-10-28 Mobile terminal system for voice recognition, database search, and resource access communications

Country Status (1)

Country Link
JP (1) JPH10133847A (en)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341156A (en) * 1998-05-27 1999-12-10 Access:Kk Telephone number guiding method, system therefor and portable telephone set
EP1134948A2 (en) * 2000-03-15 2001-09-19 Nec Corporation Information search system using radio portable terminal
WO2001099096A1 (en) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system
JP2002041277A (en) * 2000-07-28 2002-02-08 Sharp Corp Information processing unit and recording medium in which web browser controlling program is recorded
KR20020011569A (en) * 2000-08-02 2002-02-09 강민구 System and Method for providing information on the Internet through the wire/wireless/mobile telephone network with the use of voice
JP2002073682A (en) * 2000-08-24 2002-03-12 Nec Corp Information retrieval service device and its method and user terminal equipment corresponding to internet and its using method
JP2002183187A (en) * 2000-12-18 2002-06-28 Toshiba Corp Unit having internet connection mechanism facilitating home page browsing, and home page retrieval method and method and system for retrieving home page retrieval support system used in the unit
JP2002342356A (en) * 2001-05-18 2002-11-29 Nec Software Kyushu Ltd System, method and program for providing information
WO2003001780A1 (en) * 2001-06-21 2003-01-03 Sharp Kabushiki Kaisha Communication relay apparatus, communication system, data transmission method, and data transmission program
JP2003510903A (en) * 1999-09-21 2003-03-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Launching applications from indicators embedded in Short Message Service messages
US7068676B1 (en) 1999-04-30 2006-06-27 Fujitsu Limited Wireless terminal device and node device
US7809663B1 (en) 2006-05-22 2010-10-05 Convergys Cmg Utah, Inc. System and method for supporting the utilization of machine language
US7865367B2 (en) 2002-09-27 2011-01-04 International Business Machines Corporation System for enhancing live speech with information accessed from the world wide web
US8379830B1 (en) 2006-05-22 2013-02-19 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8953886B2 (en) 2004-12-03 2015-02-10 Google Inc. Method and system for character recognition
US8990235B2 (en) 2009-03-12 2015-03-24 Google Inc. Automatically providing content associated with captured information, such as information captured in real-time
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US9030699B2 (en) 2004-04-19 2015-05-12 Google Inc. Association of a portable scanner with input/output and storage devices
US9075779B2 (en) 2009-03-12 2015-07-07 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9268852B2 (en) 2004-02-15 2016-02-23 Google Inc. Search engines and systems with handheld document data capture devices
US9275051B2 (en) 2004-07-19 2016-03-01 Google Inc. Automatic modification of web pages
US9299053B2 (en) 2003-12-17 2016-03-29 West View Research, Llc Portable computerized wireless apparatus
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US9412367B2 (en) 1999-06-10 2016-08-09 West View Research, Llc Computerized information and display apparatus

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60246468A (en) * 1984-05-22 1985-12-06 Toshiba Corp Information input/output device
JPH0683870A (en) * 1992-08-31 1994-03-25 Toshiba Corp Retrieving device
JPH07219957A (en) * 1994-01-28 1995-08-18 Matsushita Electric Ind Co Ltd Information sorting device, information retrieving device and information collecting device
JPH07250381A (en) * 1994-03-14 1995-09-26 Fujitsu Ltd Information service system
JPH08147310A (en) * 1994-11-25 1996-06-07 Nippon Telegr & Teleph Corp <Ntt> Request prediction type information providing service device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60246468A (en) * 1984-05-22 1985-12-06 Toshiba Corp Information input/output device
JPH0683870A (en) * 1992-08-31 1994-03-25 Toshiba Corp Retrieving device
JPH07219957A (en) * 1994-01-28 1995-08-18 Matsushita Electric Ind Co Ltd Information sorting device, information retrieving device and information collecting device
JPH07250381A (en) * 1994-03-14 1995-09-26 Fujitsu Ltd Information service system
JPH08147310A (en) * 1994-11-25 1996-06-07 Nippon Telegr & Teleph Corp <Ntt> Request prediction type information providing service device

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11341156A (en) * 1998-05-27 1999-12-10 Access:Kk Telephone number guiding method, system therefor and portable telephone set
US7068676B1 (en) 1999-04-30 2006-06-27 Fujitsu Limited Wireless terminal device and node device
US9412367B2 (en) 1999-06-10 2016-08-09 West View Research, Llc Computerized information and display apparatus
US9715368B2 (en) 1999-06-10 2017-07-25 West View Research, Llc Computerized information and display apparatus with rapid convergence algorithm
US9709972B2 (en) 1999-06-10 2017-07-18 West View Research, Llc Computerized information and display apparatus with remote environment control
US9710225B2 (en) 1999-06-10 2017-07-18 West View Research, Llc Computerized information and display apparatus with automatic context determination
JP2003510903A (en) * 1999-09-21 2003-03-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) Launching applications from indicators embedded in Short Message Service messages
CN100403707C (en) * 2000-03-15 2008-07-16 日本电气株式会社 Information researching system for mobile hand terminal
EP1134948A2 (en) * 2000-03-15 2001-09-19 Nec Corporation Information search system using radio portable terminal
US7805145B2 (en) 2000-03-15 2010-09-28 Nec Corporation Information search system using radio portable terminal
EP1134948A3 (en) * 2000-03-15 2003-04-23 Nec Corporation Information search system using radio portable terminal
WO2001099096A1 (en) * 2000-06-20 2001-12-27 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system
US7225134B2 (en) 2000-06-20 2007-05-29 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system
JP2002041277A (en) * 2000-07-28 2002-02-08 Sharp Corp Information processing unit and recording medium in which web browser controlling program is recorded
KR20020011569A (en) * 2000-08-02 2002-02-09 강민구 System and Method for providing information on the Internet through the wire/wireless/mobile telephone network with the use of voice
JP2002073682A (en) * 2000-08-24 2002-03-12 Nec Corp Information retrieval service device and its method and user terminal equipment corresponding to internet and its using method
JP2002183187A (en) * 2000-12-18 2002-06-28 Toshiba Corp Unit having internet connection mechanism facilitating home page browsing, and home page retrieval method and method and system for retrieving home page retrieval support system used in the unit
JP2002342356A (en) * 2001-05-18 2002-11-29 Nec Software Kyushu Ltd System, method and program for providing information
WO2003001780A1 (en) * 2001-06-21 2003-01-03 Sharp Kabushiki Kaisha Communication relay apparatus, communication system, data transmission method, and data transmission program
US7865367B2 (en) 2002-09-27 2011-01-04 International Business Machines Corporation System for enhancing live speech with information accessed from the world wide web
US11240238B2 (en) 2003-12-17 2022-02-01 West View Research, Llc Computerized apparatus and methods for location-based service provision
US9349112B2 (en) 2003-12-17 2016-05-24 West View Research, Llc Computerized apparatus for transfer between locations
US9607280B2 (en) 2003-12-17 2017-03-28 West View Research, Llc Methods for shipping element processing
US11870778B2 (en) 2003-12-17 2024-01-09 West View Research, Llc Computerized apparatus and methods for user authentication and object handling
US9781110B2 (en) 2003-12-17 2017-10-03 West View Research, Llc Computerized methods for location-based service provision
US9424547B2 (en) 2003-12-17 2016-08-23 West View Research, Llc Methods of transport of one or more items between locations
US10686784B2 (en) 2003-12-17 2020-06-16 West View Research, Llc Computerized apparatus and methods for location-based service provision
US9396450B2 (en) 2003-12-17 2016-07-19 West View Research, Llc Computerized apparatus and methods for transfer between locations
US9299053B2 (en) 2003-12-17 2016-03-29 West View Research, Llc Portable computerized wireless apparatus
US10057265B2 (en) 2003-12-17 2018-08-21 West View Research, Llc Computerized vehicular apparatus for location-based service provision
US9268852B2 (en) 2004-02-15 2016-02-23 Google Inc. Search engines and systems with handheld document data capture devices
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US9633013B2 (en) 2004-04-01 2017-04-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9514134B2 (en) 2004-04-01 2016-12-06 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9030699B2 (en) 2004-04-19 2015-05-12 Google Inc. Association of a portable scanner with input/output and storage devices
US9275051B2 (en) 2004-07-19 2016-03-01 Google Inc. Automatic modification of web pages
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8953886B2 (en) 2004-12-03 2015-02-10 Google Inc. Method and system for character recognition
US8379830B1 (en) 2006-05-22 2013-02-19 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US7809663B1 (en) 2006-05-22 2010-10-05 Convergys Cmg Utah, Inc. System and method for supporting the utilization of machine language
US9549065B1 (en) 2006-05-22 2017-01-17 Convergys Customer Management Delaware Llc System and method for automated customer service with contingent live interaction
US8990235B2 (en) 2009-03-12 2015-03-24 Google Inc. Automatically providing content associated with captured information, such as information captured in real-time
US9075779B2 (en) 2009-03-12 2015-07-07 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images

Similar Documents

Publication Publication Date Title
JPH10133847A (en) Mobile terminal system for voice recognition, database search, and resource access communications
JP3402100B2 (en) Voice control host device
US6738743B2 (en) Unified client-server distributed architectures for spoken dialogue systems
EP1125279B1 (en) System and method for providing network coordinated conversational services
US7003463B1 (en) System and method for providing network coordinated conversational services
US7382770B2 (en) Multi-modal content and automatic speech recognition in wireless telecommunication systems
US6424945B1 (en) Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection
US20020091527A1 (en) Distributed speech recognition server system for mobile internet/intranet communication
JPH10177469A (en) Mobile terminal voice recognition, database retrieval and resource access communication system
US20100135269A1 (en) Retrieving voice-based content in conjunction with wireless application protocol browsing
JP2001222294A (en) Voice recognition based on user interface for radio communication equipment
CN101576901B (en) Method for generating search request and mobile communication equipment
KR100363656B1 (en) Internet service system using voice
JPH10126852A (en) Speech recognition/database retrieval communication system of mobile terminal
JPH10177468A (en) Mobile terminal voice recognition and data base retrieving communication system
JP2003271195A (en) Interaction system and interaction controller
JPH10134047A (en) Moving terminal sound recognition/proceedings generation communication system
JPH10124291A (en) Speech recognition communication system for mobile terminal
US20020077814A1 (en) Voice recognition system method and apparatus
KR100372850B1 (en) Apparatus for interpreting and method thereof
KR100367579B1 (en) Internet utilization system using voice
KR100486030B1 (en) Method and Apparatus for interfacing internet site of mobile telecommunication terminal using voice recognition
JPH10190865A (en) Mobile terminal voice recognition/format sentence preparation system
JP2004265217A (en) Mobile communication terminal having voice recognition function and keyword retrieval method using the same terminal
CN102957711A (en) Method and system for realizing website address location on television set by voice

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060411