JP2018136740A - Network system, information processing method, server and terminal - Google Patents
Network system, information processing method, server and terminal Download PDFInfo
- Publication number
- JP2018136740A JP2018136740A JP2017030794A JP2017030794A JP2018136740A JP 2018136740 A JP2018136740 A JP 2018136740A JP 2017030794 A JP2017030794 A JP 2017030794A JP 2017030794 A JP2017030794 A JP 2017030794A JP 2018136740 A JP2018136740 A JP 2018136740A
- Authority
- JP
- Japan
- Prior art keywords
- name
- cpu
- user
- server
- celebrity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、メッセージなどの音声を出力するためのネットワークシステム、情報処理方法、サーバ、および端末の技術に関し、特に音声入力された文言を漢字に変換するための技術に関する。 The present invention relates to the technology of a network system, an information processing method, a server, and a terminal for outputting a voice such as a message, and more particularly to a technology for converting a voiced word into kanji.
従来から、ユーザに適したメッセージを出力するための技術が知られている。たとえば、特開2016−24636号公報(特許文献1)には、制御装置、制御方法および制御プログラムが開示されている。特許文献1によると、制御装置は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、検索部によって検索された広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、を備えたことを特徴とする。このため、制御装置は、ユーザに適したメッセージを出力することができる。 Conventionally, a technique for outputting a message suitable for a user is known. For example, Japanese Patent Laying-Open No. 2016-24636 (Patent Document 1) discloses a control device, a control method, and a control program. According to Patent Literature 1, the control device is searched by a search unit that searches for advertisement information that is information related to an advertisement that is output as a response message, based on the characteristics of sound in a conversation between the dialog agent system and the user, and the search unit. And an output control unit that controls to output an advertisement related to the advertisement information as a response message. For this reason, the control apparatus can output a message suitable for the user.
本発明の目的は、音声入力された文言を正しい漢字に変換することができるネットワークシステム、情報処理方法、サーバ、または端末を提供することにある。 An object of the present invention is to provide a network system, an information processing method, a server, or a terminal that can convert a speech input word to a correct kanji.
本発明のある態様に従うと、ネットワークシステムが提供される。ネットワークシステムは、音声を受け付ける端末と、音声の文言に対応する漢字の変換候補を端末に音声出力させるサーバと、を備える。 According to an aspect of the present invention, a network system is provided. The network system includes a terminal that receives voice and a server that causes the terminal to output a kanji conversion candidate corresponding to the wording of the voice.
以上のように、本発明によれば、音声入力された文言を正しい漢字に変換することができるネットワークシステム、情報処理方法、サーバ、または端末が提供される。 As described above, according to the present invention, there is provided a network system, an information processing method, a server, or a terminal that can convert a speech input word to a correct kanji.
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
<第1の実施の形態>
<ネットワークシステム1の全体構成>
Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following description, the same parts are denoted by the same reference numerals. Their names and functions are also the same. Therefore, detailed description thereof will not be repeated.
<First Embodiment>
<Overall configuration of network system 1>
まず、図1を参照して本実施の形態にかかるネットワークシステム1の全体構成について説明する。本実施の形態にかかるネットワークシステム1は、主に、サーバ100と、ニュースや天気予報などのデータを提供してくれる他の情報提供サーバ100B,100Cと、ロボット300Aや冷蔵庫やエアコンなどの電気機器(端末)と、を含む。
First, the overall configuration of the network system 1 according to the present embodiment will be described with reference to FIG. The network system 1 according to the present embodiment mainly includes a
なお、電気機器は、ロボット300Aに限らず、冷蔵庫、電子レンジ、エアコン、洗濯機、掃除機、空気清浄器、加湿器、除湿器、炊飯器、照明などの家電、携帯電話、スマートフォン、テレビ、ハードディスクレコーダ、プロジェクタ、音楽プレーヤ、ゲーム機、パーソナルコンピュータなどのAV(オーディオ・ビジュアル)機器、組み込み照明、太陽光発電機、インターホン、給湯器、温水洗浄便座コントローラなどの住宅設備、などであってもよい。なお、以下では、これらの装置を総称して、電気機器300ともいう。
<ネットワークシステム1の動作概要>
Note that the electrical device is not limited to the
<Operation overview of network system 1>
本実施の形態においては、電気機器300がユーザに話しかけたり、ユーザが電気機器300に話しかけたり、すなわち音声メッセージのやり取りが行われるものである。さらに、本実施の形態においては、サーバ100が、電気機器300に音声メッセージを出力させたり、電気機器300を介してユーザからの音声メッセージをサーバ100が取得したりする。
In the present embodiment, the
図1を参照して本実施の形態にかかるネットワークシステム1の第1の動作概要について説明する。まず、図1(A)に示すように、電気機器300がサーバ100からの指令に基づいて、ユーザに氏名の音声入力を促す。なお、図28(α)に示すように、電気機器300は、サーバ100からの指令に基づいて、郵便番号や、それに基づく住所や、性別や、年齢や、その他の趣味などの対話などの後に、ユーザに氏名の音声入力を促すことが好ましい。これによって、サーバ100は、ユーザの住所や性別や年齢やその他の趣味を手掛かりにして、ユーザの氏名に関する可能性が高い変換候補を選択することができる。
A first operation overview of the network system 1 according to the present embodiment will be described with reference to FIG. First, as illustrated in FIG. 1A, the
図1(B)に示すように、ユーザが氏名を話す。電気機器300は、入力された音声のデータをサーバ100に送信する。サーバ100は、音声のデータに対応するカナを特定し、データベースから当該カナの全部または一部、たとえば名字など、を含む有名人を検索する。同じカナの名字の有名人を見つけると、サーバ100は、当該有名人の氏名を電気機器300に送信する。
As shown in FIG. 1B, the user speaks his / her name. The
図1(C)に示すように、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名字の漢字が当該有名人の名字の漢字と同じであるか否かをユーザに尋ねる。
As shown in FIG. 1C, the
図1(D)に示すように、当該質問にユーザが肯定的な回答を返すと、電気機器300は、その旨をサーバ100に送信する。サーバ100は、データベースから氏名の残りの部分のカナに対応する漢字を有する有名人を検索する。サーバ100は、データベースから、該当する有名人を検索する。同じカナに対応する漢字を含む名前を有する有名人を見つけると、サーバ100は、当該有名人の氏名を電気機器300に送信する。そして、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名前の漢字が当該有名人の名前の漢字と同じであるか否かをユーザに尋ねる。
As illustrated in FIG. 1D, when the user returns a positive answer to the question, the
なお、図2に示すように、ユーザが電気機器300からのメッセージに質問に否定的な回答を返した場合は、電気機器300は、その旨をサーバ100に送信する。サーバ100は、データベースからユーザの氏名の一部のカナに対応する別の漢字を含む名前を有する別の有名人を検索する。該当する別の有名人を見つけると、サーバ100は、当該別の有名人の氏名を電気機器300に送信する。そして、図2(D)に示すように、電気機器300は、当該別の有名人の氏名を音声出力して、ユーザの名字が当該別の有名人の名字と同じであるか否かをユーザに尋ねる。
As shown in FIG. 2, when the user returns a negative answer to the question in the message from the
このように、本実施の形態にかかるネットワークシステム1は、音声のやり取りによって、カナを漢字に変換したり、変換候補が正しいか否かをユーザに確認したり、することができる。つまり、変換候補の漢字を含む有名人の名前を提示することによって、ユーザは画面を見ずに電気機器300が提示する漢字を音声で認識することができる。以下、このような機能を実現するためのネットワークシステム1の具体的な構成について詳述する。
<サーバ100のハードウェア構成>
As described above, the network system 1 according to the present embodiment can convert kana to kanji by exchanging voices, or can confirm to the user whether or not the conversion candidate is correct. That is, by presenting the names of celebrities including conversion candidate kanji, the user can recognize the kanji presented by the
<Hardware Configuration of
まず、本実施の形態にかかるネットワークシステム1を構成するサーバ100のハードウェア構成の一態様について説明する。他の情報提供サーバ100B、100Cもサーバ100と同様の構成を有しているため、ここでは説明を繰り返さない。
First, an aspect of the hardware configuration of the
図3を参照して、サーバ100は、主たる構成要素として、CPU(Central Processing Unit)110と、メモリ120と、操作部140と、通信インターフェイス160とを含む。
Referring to FIG. 3,
CPU110は、メモリ120に記憶されているプログラムを実行することによって、サーバ100の各部を制御する。たとえば、CPU110は、メモリ120に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。
The
メモリ120は、各種のRAM(Random Access Memory)、各種のROM(Read-Only Memory)などによって実現される。メモリ120は、CPU110によって実行されるプログラムや、CPU110によるプログラムの実行により生成されたデータ、入力されたデータ、有名人辞書121などを記憶する。
The
ここで、有名人辞書121は、図4に示すように、たとえば芸能人毎に、氏名の漢字のデータと、氏名のカナのデータとを含む。なお、図5に示すように、有名人辞書は、芸能人毎およびスポーツ選手毎に、氏名の漢字のデータと、氏名のカナのデータと、有名人の種類や職業などの対応関係を含んでもよい。
Here, as shown in FIG. 4, the
図3に戻って、操作部140は、サービスの管理者などの命令を受け付けて、当該命令をCPU110に入力する。
Returning to FIG. 3, the
通信インターフェイス160は、CPU110からのデータを、インターネット、キャリア網、ルータなどを介して電気機器300などの他の装置に送信する。逆に、通信インターフェイス160は、インターネット、キャリア網、ルータなどを介して電気機器300などの他の装置からのデータを受信して、CPU110に受け渡す。
<サーバ100における情報処理>
The
<Information processing in
次に、図6を参照しながら、本実施の形態にかかるサーバ100における情報処理について説明する。サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からデータを受信すると以下の処理を実行する。
Next, information processing in the
CPU110は、受信したデータから音声データを取得する(ステップS102)。CPU110は、音声データをテキストに変換する(ステップS104)。すなわち、この時点で、CPU110は、電気機器300に音声入力された言葉のカナのデータを取得したことになる。
CPU110 acquires audio | voice data from the received data (step S102). CPU110 converts audio | voice data into a text (step S104). That is, at this point, the
CPU110は、有名人辞書を参照して、入力された氏名のカナのデータに全文一致する氏名を有する有名人を検索する(ステップS106)。CPU110は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいた場合(ステップS110においてYESである場合)、CPU110は、ユーザの氏名のカナの変換候補として当該有名人の名前を提示するためのテキストデータを作成する(ステップS122)。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうは、俳優の竹内太郎と同じ漢字ですか?」というテキストデータを作成する。CPU110は、ステップS132からの処理を実行する。
The
一方、CPU110は、入力された氏名のカナのデータに全文一致する有名人がいなかった場合(ステップS110においてNOである場合)、有名人辞書を参照して、入力された氏名の一部のカナに一部一致する氏名を有する有名人を検索する(ステップS120)。そして、CPU110は、ユーザの氏名の一部の変換候補として当該有名人の名前を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、俳優の武田次郎の武ですか?」というテキストデータを作成する(ステップS128)。
On the other hand, if there is no celebrity that matches the full text of the input name data (if NO in step S110),
CPU110は、作成したテキストデータの音声データを作成する(ステップS132)。CPU110は、通信インターフェイス160を介して、音声データを電気機器300に送信する(ステップS134)。CPU110は、通信インターフェイス160を介して、電気機器300からの回答を待ち受ける。
このとき、電気機器300のCPU310は、通信インターフェイス360を介してサーバ100から受信したデータに基づいて、「たけうちたろうのたけは、俳優の武田次郎の武ですか?」というメッセージをスピーカ370に音声出力させる。そして、電気機器300のCPU310は、マイク380を介してユーザからの返答を受け付けて、当該データをサーバ100に送信する。
At this time, based on the data received from the
サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300から肯定的な回答を受け付けると(ステップS136においてYESである場合)、ステップS134で送信した変換候補が正しかったとしてユーザの氏名の全部または一部のカナに対応する漢字を確定する(ステップS140)。CPU110は、ユーザの氏名のうちに、対応する漢字が確定していない部分が未だ残っているか否かを判断する(ステップS142)。ユーザの氏名の全てに対応する漢字が確定すると(ステップS142においてNOである場合)、CPU110は、通信インターフェイス160を介して次の電気機器300からのデータを待ち受ける。
When
CPU110は、ユーザの氏名のうちに、対応する漢字が確定していないカナが未だ残っている場合(ステップS142においてYESである場合)、当該未だ確定していないカナに対して、ステップS106からの処理を繰り返す。
If there is still kana for which the corresponding kanji has not been confirmed in the user's name (YES in step S142),
また、CPU110は、通信インターフェイス160を介して、電気機器300から否定的な回答を受け付けた場合(ステップS136においてNOの後、ステップS138においてYESである場合)も、当該未だ確定していないカナに対して、ステップS106からの処理を繰り返す。なお、この場合は、ステップS106やステップS120において、CPU110は、ステップS134で送信した候補以外の有名人から、ユーザの氏名のカナに一致するカナに対応する別の漢字を含む氏名を有する有名人を選択する。
<電気機器300のハードウェア構成>
<Hardware Configuration of
次に、図7を参照して、ネットワークシステム1を構成する電気機器300の構成の一態様について説明する。電気機器300は、主たる構成要素として、CPU310と、メモリ320と、ディスプレイ330と、操作部340と、カメラ350、通信インターフェイス360と、スピーカ370と、マイク380と、機器駆動部390とを含む。
Next, with reference to FIG. 7, an aspect of the configuration of the
CPU310は、メモリ320あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、電気機器300の各部を制御する。
The
メモリ320は、各種のRAMや、各種のROMなどによって実現される。メモリ320は、CPU310によって実行される機器駆動プログラムや会話プログラムやその他のプログラムや、CPU310によるプログラムの実行により生成されたデータ、サーバ100や他のサーバから受信したデータ、操作部340を介して入力されたデータなどを記憶する。
The
ディスプレイ330は、CPU310からの信号に基づいて、文字や画像などを出力する。ディスプレイ330は、単にライトであってもよい。
The
操作部340は、ボタン、タッチパネルなどによって実現され、ユーザからの命令を受け付けて、当該命令をCPU310に入力する。なお、ディスプレイ330と操作部340とは、タッチパネルを構成してもよい。
The
また、操作部340は、近接センサや温度センサなどであってもよい。この場合は、CPU310は、操作部340としての近接センサや温度センサを介して、ユーザが電気機器300に手をかざしたことを検知して、各種の動作を開始する。たとえば、電気機器300がロボットであって、近接センサが額の近辺に配置されることによって、ユーザが電気機器300をなでたり・たたいたりすることを電気機器300が検知して、ユーザ操作として受け付けてもよい。
The
カメラ350は、画像を撮影して、画像データをCPU310に受け渡す。CPU310は、カメラ350からの画像データに基づいてユーザの動きを操作命令として特定してもよいし、画像データをサーバ100に提供してサーバ100がユーザの動きを操作命令として特定してもよい。
The
通信インターフェイス360は、無線LAN通信あるいは有線LANなどの通信モジュールによって実現される。通信インターフェイス360は、有線通信あるいは無線通信によってサーバ100などの他の装置との間でデータをやり取りする。
The
スピーカ370は、CPU310からの信号に基づいて、音声を出力する。より詳細には、本実施の形態においては、CPU310は、通信インターフェイス360を介してサーバ100から受信した音声データに基づいてスピーカ370に音声メッセージを出力させる。
The speaker 370 outputs sound based on the signal from the
マイク380は、外部からの音声に基づいて音声信号を作成し、CPU310に入力する。より詳細には、本実施の形態においては、CPU310は、マイク380から取得した音声データを、通信インターフェイス160を介してサーバ100に送信する。
The
機器駆動部390は、CPU310からの信号に基づいて、電気機器300の各部(モータやヒータなど)を制御する。
<第2の実施の形態>
The
<Second Embodiment>
第1の実施の形態は、変換候補の漢字が選択されるたびに、電気機器300に確認の音声メッセージを提供するものであったが、そのような形態には限られない。本実施の形態においては、入力された音声に対応するカナの全部、たとえば氏名の全部、に対応する漢字の変換候補をまとめて電気機器300に提供するものである。
In the first embodiment, each time a conversion candidate kanji is selected, a confirmation voice message is provided to the
以下では、図8を参照しながら、本実施の形態にかかるサーバ100における情報処理について説明する。サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からデータを受信すると以下の処理を実行する。
Hereinafter, information processing in the
CPU110は、受信したデータから音声データを取得する(ステップS102)。CPU110は、音声データをテキストに変換する(ステップS104)。すなわち、この時点で、CPU110は、音声入力された言葉のカナのデータを取得したことになる。
CPU110 acquires audio | voice data from the received data (step S102). CPU110 converts audio | voice data into a text (step S104). That is, at this point, the
CPU110は、有名人辞書122を参照して、入力された氏名のカナのデータに全文一致する氏名を有する有名人を検索する(ステップS106)。CPU110は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいた場合(ステップS110においてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該有名人の名前を提示するためのテキストデータを作成する(ステップS122)。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうは、俳優の竹内太郎と同じですか?」というテキストデータを作成する。CPU110は、ステップS130からの処理を実行する。
The
一方、CPU110は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいなかった場合(ステップS110においてNOである場合)、有名人辞書を参照して、入力された氏名の一部のカナに一部一致する氏名を有する有名人を検索する(ステップS120)。そして、CPU110は、ユーザの氏名の一部の変換候補として当該有名人の名前を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、俳優の武田次郎の武ですか?」というテキストデータを作成する(ステップS128)。
On the other hand, if there is no celebrity having a full name that matches the full text of the input name data (if NO in step S110),
CPU110は、ユーザの氏名のカナのうちに、対応する漢字が確定していないものが未だ残っているか否かを判断する(ステップS130)。CPU110は、ユーザの氏名のカナのうちに、対応する漢字が確定していないものが未だ残っている場合(ステップS130においてYESである場合)、当該未だ対応の漢字が確定していないカナに対して、ステップS106からの処理を繰り返す。
ユーザの氏名の全てのカナに対応する漢字が確定すると(ステップS130においてNOである場合)、CPU110は、作成したテキストデータを組み合わせる(ステップS131)。CPU110は、組み合わせたテキストデータを音声データに変換する(ステップS132)。CPU110は、通信インターフェイス160を介して、音声データを電気機器300に送信する(ステップS134)。CPU110は、通信インターフェイス160を介して、電気機器300からの回答を待ち受ける。
When the kanji corresponding to all the kana characters of the user's name is confirmed (NO in step S130),
CPU110は、通信インターフェイス160を介して、電気機器300から肯定的な回答を受け付けると(ステップS136においてYESである場合)、ステップS134で送信した変換候補が正しかったとして、ユーザの氏名の全部のカナに対応する漢字を確定する(ステップS140)。CPU110は通信インターフェイス160を介して次の電気機器300からのデータを待ち受ける。
When
一方、CPU110は、通信インターフェイス160を介して、電気機器300から否定的な回答を受け付けた場合(ステップS136においてNOの後、ステップS138においてYESである場合)、ステップS106からの処理を繰り返す。なお、この場合は、ステップS106やステップS120において、CPU110は、ステップS134で送信した候補以外の有名人から、ユーザの氏名のカナと一致するカナの別の漢字の氏名を有する別の有名人を選択する。
<第3の実施の形態>
On the other hand, when
<Third Embodiment>
本実施の形態においては、ユーザに関する様々な属性に基づいて、変換候補に挙げる有名人を変化させるものである。ユーザが知っている可能性が高い有名人を候補に挙げた方が、ユーザが変換候補の漢字を認識しやすいからである。 In the present embodiment, celebrities listed as conversion candidates are changed based on various attributes relating to the user. This is because it is easier for the user to recognize the kanji as the conversion candidate if the celebrity who is likely to know the user is listed as a candidate.
本実施の形態においては、サーバ100のメモリ120は、図9に示すような有名人辞書122を格納する。有名人辞書122は、芸能人毎に、氏名の漢字のデータと、氏名のカナのデータと、当該芸能人を良く知っている年代と、当該芸能人を良く知っている性別とを含む。
In the present embodiment, the
なお、対象となる有名人を良く知っている可能性が高いユーザの属性は、「年代」と「性別」だけには限らない。ユーザの属性は、「年代」だけ、もしくは「性別」だけでもよいし、さらに別の項目があってもよい。例えば、ユーザの属性にユーザの住所が含まれて、芸能人毎に、当該芸能人をよく知っている地域が含まれてもよい。ローカルの番組によく出演する人は、その地域での知名度は高いが、それ以外の地域では知名度が低いためである。 Note that the attributes of a user who is likely to know the target celebrity well are not limited to “age” and “sex”. The user attribute may be only “age” or “sex”, or may have another item. For example, the user's address may be included in the user's attributes, and an area where the entertainer is well known may be included for each entertainer. This is because people who often appear in local programs have a high level of publicity in the area, but are low in other areas.
なお、図10に示すような、芸能人だけでなく、野球選手や他のスポーツの選手や政治家なども含む有名人辞書122Bを利用してもよい。この場合、有名人辞書122Bは、有名人毎に、氏名の漢字のデータと、氏名のカナのデータと、当該有名人の種類と、当該有名人を良く知っている年代と、当該有名人を良く知っている性別とを含む。
Note that a
次に、図11を参照しながら、本実施の形態にかかるサーバ100における情報処理について説明する。サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からデータを受信すると以下の処理を実行する。
Next, information processing in the
CPU110は、受信したデータから音声データを取得する(ステップS102)。CPU110は、音声データに基づいて、ユーザの声質を特定し、ユーザの性別や年齢などの属性を特定する(ステップS103)。CPU110は、音声データをテキストに変換する(ステップS104)。すなわち、この時点で、CPU110は、電気機器300に音声入力された言葉のカナのデータを取得したことになる。
CPU110 acquires audio | voice data from the received data (step S102). CPU110 specifies a user's voice quality based on audio | voice data, and specifies attributes, such as a user's sex and age (step S103). CPU110 converts audio | voice data into a text (step S104). That is, at this point, the
CPU110は、有名人辞書を参照して、入力された氏名のカナのデータに全文一致するカナの氏名を有する有名人を検索する(ステップS106)。CPU110は、入力された氏名のカナに全文一致する氏名を有する有名人がいた場合(ステップS110においてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該有名人の氏名を提示するためのテキストデータを作成する(ステップS122)。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうは、俳優の竹内太郎と同じ漢字ですか?」というテキストデータを作成する。CPU110は、ステップS132からの処理を実行する。
The
一方、CPU110は、入力された氏名のカナのデータに全文一致する名前の有名人がいなかった場合(ステップS110においてNOである場合)、有名人辞書を参照して、入力されたユーザの氏名の一部のカナに一部一致する氏名を有する有名人を検索する(ステップS120)。ここで、本実施の形態においては、CPU110は、ステップS103で特定したユーザの属性情報に基づいて、検索結果からユーザが知っている可能性が高い有名人を優先して選択する(ステップS121)。CPU110は、ユーザの氏名の一部のカナの変換候補として当該有名人の氏名を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、芸能人の武田次郎の武ですか?」というテキストデータを作成する(ステップS128)。以降の処理は、第1の実施の形態のそれと同様であるため、ここでは説明を繰り返さない。
On the other hand, if there is no celebrity whose name matches the full text of the input name data (if NO in step S110),
なお、上記の実施の形態では、ステップS103において、音声からユーザの年齢や性別などを特定したが、サーバ100のCPU110は、別のサービスのユーザ情報などに基づいて、ユーザの属性情報を取得してもよい。たとえば、サーバ100やサーバ100がアクセス可能なデータベースが、図12に示すようなユーザ情報テーブル125を記憶してもよい。ユーザ情報テーブル125は、ユーザ毎に、ユーザIDや、ニックネームや、ユーザの機器IDや、機器の種類や、郵便番号や、住所や、年齢や、性別や、アドレスや、趣味などを含む。
In the above embodiment, the user's age, sex, and the like are specified from the voice in step S103. However, the
この場合は、電気機器300からの受信データから機器IDなどを取得することによって、図11におけるステップS103において、サーバ100のCPU110は、ユーザ情報テーブル125を参照して、対応するユーザの属性情報を取得することができる。
In this case, by acquiring the device ID and the like from the received data from the
あるいは、サーバ100のCPU110は、ユーザに名前の入力を促す前に、複雑な漢字の特定が必要ない生年月日や性別などの属性情報を電気機器300を介して取得してもよい。さらには、サーバ100のCPU110は、ユーザに名前の入力を促す前の対話内容に応じて、ユーザの生年月日や性別や好きな芸能人のタイプや趣味などの属性情報を電気機器300を介して取得してもよい。
<第4の実施の形態>
Alternatively, the
<Fourth embodiment>
第1から第3の実施の形態では、変換候補として芸能人やスポーツ選手や政治家などの名前を利用するものであったが、そのような変換候補には限られない。たとえば、図13に示すように、変換候補には、歴史上の人物の名前を利用してもよい。この場合は、図14に示すように、サーバ100のメモリ120が、歴史有名人物辞書123として、歴史上の人物毎の、名前の漢字のデータと、名前のカナのデータと、該人物を良く知っている年代と、当該人物を良く知っている性別などとの対応関係を記憶する。
In the first to third embodiments, names of celebrities, athletes, politicians, and the like are used as conversion candidates. However, the conversion candidates are not limited to such conversion candidates. For example, as shown in FIG. 13, the names of historical persons may be used as conversion candidates. In this case, as shown in FIG. 14, the
あるいは、図15に示すように、変換候補には、有名な地名を利用してもよい。この場合は、図16に示すように、サーバ100のメモリ120が、地名辞書124として、地名毎の、地名の漢字のデータと、地名のカナのデータと、当該地名を良く知っているユーザの属性などの対応関係を記憶する。
Alternatively, as shown in FIG. 15, a famous place name may be used as a conversion candidate. In this case, as shown in FIG. 16, the
あるいは、図17に示すように、変換候補には、駅名を利用してもよい。この場合は、サーバ100のメモリ120は、駅名辞書として、駅名毎の、駅名毎の漢字のデータと、駅名のカナのデータと、当該駅名を良く知っているユーザの属性などの対応関係を記憶する。
Alternatively, as shown in FIG. 17, a station name may be used as a conversion candidate. In this case, the
さらには、図18に示すように、変換候補には、一般名詞や熟語などを利用してもよい。この場合は、サーバ100のメモリ120は、一般名詞や熟語を含む、国語辞典や漢字辞典を記憶する。
Furthermore, as shown in FIG. 18, general nouns and idioms may be used as conversion candidates. In this case, the
そして、サーバ100のCPU110は、カナに対応する漢字の変換候補を検索する際に、それらの複数種類の辞書を利用することが好ましい。この場合は、たとえば、サーバ100のCPU110が、図12のステップS122において、ユーザの属性に基づいて、ユーザの住所に近い地名を優先して候補にあげたり、ユーザの住所に近い場所にゆかりのある歴史上の人物を優先して候補にあげたり、ユーザの年齢に人気あるアイドルの名前を優先して候補にあげたりすることが好ましい。
<第5の実施の形態>
And when CPU110 of the
<Fifth embodiment>
第1から第4の実施の形態においては、全文一致や一部一致によって、ユーザの音声に対応するカナの変換候補を探すものであった。しかしながら、このような変換候補の検索方法および提示方法には限られない。 In the first to fourth embodiments, a kana conversion candidate corresponding to a user's voice is searched by full-text matching or partial matching. However, the present invention is not limited to such a conversion candidate search method and presentation method.
たとえば、図19を参照して、サーバ100は、ユーザの氏名の全部を含む有名人が見つからない場合、データベースから、1字だけ余分な漢字が含まれる氏名や名字や名前を有する有名人や1字だけ漢字が足りない氏名や名字や名前を有する有名人を検索する。該当する有名人を見つけると、サーバ100は、当該有名人の氏名を電気機器300に送信する。図19(C)に示すように、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名字が当該有名人の名字の漢字の一文字を取ったものと同じであるか否か、あるいはユーザの名字が当該有名人の名字に漢字を一文字追加したものと同じであるか否か、をユーザに尋ねる。
For example, referring to FIG. 19, when a celebrity that includes the entire name of a user is not found, the
あるいは、図20を参照して、サーバ100は、ユーザの氏名の全部を含む有名人が見つからない場合、データベースから、ユーザのカナに対応する漢字の前後を入れ替えた氏名や名字や名前を有する有名人を検索する。漢字の前後を入れ替えた氏名や名字や名前を有する有名人を見つけると、サーバ100は、当該有名人の氏名を電気機器300に送信する。図20(C)に示すように、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名字が当該有名人の名字の漢字の前後を入れ替えたものと同じであるか否かをユーザに尋ねる。
Alternatively, referring to FIG. 20, when a celebrity that includes all of a user's name is not found, the
次に、図21を参照しながら、本実施の形態にかかるサーバ100における情報処理について説明する。サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からデータを受信すると以下の処理を実行する。
Next, information processing in the
CPU110は、受信したデータから音声データを取得する(ステップS102)。CPU110は、音声データをテキストに変換する(ステップS104)。すなわち、この時点で、CPU110は、音声入力された言葉のカナのデータを取得したことになる。
CPU110 acquires audio | voice data from the received data (step S102). CPU110 converts audio | voice data into a text (step S104). That is, at this point, the
CPU110は、有名人辞書を参照して、入力された氏名のカナのデータに全文一致する氏名を有する有名人を検索する(ステップS106)。CPU110は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいた場合(ステップS110においてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該有名人の氏名をユーザに提示するためのテキストデータを作成する(ステップS122)。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうは、芸能人の竹内太郎と同じですか?」というテキストデータを作成する。CPU110は、ステップS132からの処理を実行する。
The
CPU110は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいなかった場合(ステップS110においてNOである場合)、有名人辞書を参照して、1字だけ異なる漢字が含まれる氏名や名字や名前を有する有名人や1字だけ漢字が足りない氏名や名字や名前を有する有名人を検索する(ステップS112)。該当する有名人を見つけると(ステップS114にてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該有名人の氏名を提示するためのテキストデータを作成する(ステップS124)。たとえば、ユーザが「たけうち」という音声を入力していた場合には、「たけうちは、芸能人の竹野内太郎の野を取った竹内ですか?」というテキストデータを作成する。CPU110は、ステップS132からの処理を実行する。
If there is no celebrity having a full name that matches the full text in the input kana data (if NO in step S110), the
CPU110は、1字だけ異なる漢字が含まれる氏名や名字や名前を有する有名人や1字だけ漢字が足りない氏名や名字や名前を有する有名人が見つからなかった場合(ステップS114にてNOである場合)、有名人辞書を参照して、漢字の前後を入れ替えた氏名や名字や名前を有する有名人を検索する(ステップS116)。漢字の前後を入れ替えた氏名や名字や名前を有する有名人を見つけると(ステップS118にてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該有名人の氏名を提示するためのテキストデータを作成する(ステップS126)。たとえば、ユーザが「ながまつ」という音声を入力していた場合には、「ながまつは、俳優の松永の松と永を入れ替えた永松ですか?」というテキストデータを作成する。CPU110は、ステップS132からの処理を実行する。
CPU110は、漢字の前後を入れ替えた氏名や名字や名前を有する有名人が見つからなかった場合(ステップS118にてNOである場合)、入力された氏名の一部のカナに一部一致する氏名を有する有名人を検索する(ステップS120)。そして、CPU110は、ユーザの氏名の一部の変換候補として当該有名人の名前を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、芸能人の武田次郎の武ですか?」というテキストデータを作成する(ステップS128)。
When
CPU110は、作成したテキストデータの音声データを作成する(ステップS132)。その後の処理は、第1の実施の形態のそれと同様であるため、ここでは説明を繰り返さない。
<第6の実施の形態>
<Sixth Embodiment>
本実施の形態においては、ユーザの氏名の全てのカナに対応する漢字が特定された後に、当該漢字に誤りがないかを確認する処理を実行するものである。本実施の形態においては、図6のステップS142の後で、電気機器300にて候補として出力された漢字と同じ漢字を有する別の有名人を出力することによって、ユーザが先に提示された変換候補の漢字に関して勘違いをしていないか、確認することができるものである。
In the present embodiment, after the kanji corresponding to all the kana characters of the user's name is specified, a process for confirming whether or not the kanji is correct is executed. In the present embodiment, after step S142 of FIG. 6, the conversion candidate presented first by the user by outputting another celebrity having the same Chinese character as the candidate that was output as a candidate by
より詳細には、図22に示すように、図6のステップS142の後で、サーバ100のCPU110は、有名人辞書を参照して、1字だけ異なる漢字が含まれる氏名や名字や名前を有する別の有名人や1字だけ漢字が足りない氏名や名字や名前を有する別の有名人を検索する(ステップS212)。該当する別の有名人を見つけると(ステップS214にてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該別の有名人の氏名を提示するためのテキストデータを作成する(ステップS224)。たとえば、ユーザが「おおやま」という音声を入力していた場合には、「おおやまは、プロ野球選手の大内山太郎の内を取った大山ですか?」というテキストデータを作成する。CPU110は、ステップS232からの処理を実行する。
More specifically, as shown in FIG. 22, after step S <b> 142 in FIG. 6, the
CPU110は、1字だけ異なる漢字が含まれる氏名や名字や名前を有する有名人や1字だけ漢字が足りない氏名や名字や名前を有する有名人が見つからなかった場合(ステップS214にてNOである場合)、有名人辞書を参照して、漢字の前後を入れ替えた氏名や名字や名前を有する別の有名人を検索する(ステップS216)。漢字の前後を入れ替えた氏名や名字や名前を有する別の有名人を見つけると(ステップS218にてYESである場合)、CPU110は、ユーザの氏名の変換候補として当該別の有名人の氏名を提示するためのテキストデータを作成する(ステップS226)。たとえば、ユーザが「やまうち」という音声を入力していた場合には、「やまうちは、漫才師の内山の内と山を入れ替えた山内ですか?」というテキストデータを作成する。CPU110は、ステップS232からの処理を実行する。
CPU110は、漢字の前後を入れ替えた氏名や名字や名前を有する有名人が見つからなかった場合(ステップS218にてNOである場合)、入力された氏名の一部のカナに一部一致する有名人を検索する(ステップS220)。そして、CPU110は、ユーザの氏名の一部の変換候補として当該有名人の氏名を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、歴史上の人物の武田信玄の武ですか?」というテキストデータを作成する(ステップS228)。
CPU110 searches for a celebrity that partially matches a part of the input name if a celebrity having a name, surname, or name with the front and rear characters replaced is not found (NO in step S218). (Step S220). Then, the
CPU110は、作成したテキストデータの音声データを作成する(ステップS232)。CPU110は、通信インターフェイス160を介して、音声データを電気機器300に送信する(ステップS234)。CPU110は、通信インターフェイス160を介して、電気機器300からの回答を待ち受ける。
CPU110は、通信インターフェイス160を介して、電気機器300から肯定的な回答を受け付けると(ステップS236においてYESである場合)、ステップS134で送信した変換候補が正しかったとしてユーザの氏名の全部または一部のカナに対応する漢字を最終確定する(ステップS240)。CPU110は、ユーザの氏名のカナのうちに、対応する漢字の確認が完了していないカナが未だ残っているか否かを判断する(ステップS242)。ユーザの氏名のカナの全ての対応する漢字が確定すると(ステップS242においてNOである場合)、CPU110は通信インターフェイス160を介して次の電気機器300からのデータを待ち受ける。
When
CPU110は、ユーザの氏名のカナのうちに、対応する漢字の確認が完了していないカナが未だ残っている場合(ステップS242においてYESである場合)、当該未だ確定していないカナに対して、ステップS212からの処理を繰り返す。
If there is still a kana for which the confirmation of the corresponding kanji has not been completed among the kanas of the user's name (if YES in step S242), the
また、CPU110は、通信インターフェイス160を介して、電気機器300から否定的な回答を受け付けた場合(ステップS236においてNOの後、ステップS238においてYESである場合)、図6などのステップS102からの処理を実行する。あるいは、CPU110は、ステップS120からの処理を実行する。あるいは、CPU110は、音声データを取得するところから、すなわちステップS106からやり直してもよい。
Further, when
なお、本実施の形態においては、ユーザの氏名の全てのカナに対応する漢字が特定された後に、当該漢字に誤りがないかを確認する処理を実行するものであった。しかしながら、ユーザの氏名の一部のカナに対応する漢字が特定される度に、当該漢字に誤りがないかを確認する処理を実行してもよい。この場合は、図6のステップS140の後で、CPU110は、図22のステップS212からの処理を実行する。
<第7の実施の形態>
In the present embodiment, after the kanji corresponding to all the kana characters of the user's name is specified, a process for confirming whether or not the kanji is correct is executed. However, every time a kanji corresponding to a part of the name of the user is identified, a process for confirming whether or not the kanji is correct may be executed. In this case, after step S140 in FIG. 6, the
<Seventh embodiment>
第1から第6の実施の形態においては、音声入力されたユーザの氏名を漢字に変換するため場合について説明したが、音声入力されるのは、氏名に限らず、名字だけでも、名前だけでも、住所でも、商品名でも、他のメッセージでも良い。この場合も、サーバ100が、有名人辞書や地名辞書などに基づいて、電気機器300に漢字候補を音声出力させる。
<第8の実施の形態>
In the first to sixth embodiments, a case has been described in which a user's name inputted by voice is converted into Kanji. However, what is inputted by voice is not limited to a name, but only a name or just a name. , Address, product name, or other message. Also in this case, the
<Eighth Embodiment>
第1から第7の実施の形態においては、電気機器300がユーザの音声データを送信し、サーバ100が音声データからテキストすなわちカナを特定するものであった。しかしながら、電気機器300がユーザの音声データからテキストすなわちカナを特定して、電気機器300が当該テキストデータをサーバ100に送信してもよい。そして、サーバ100がテキストデータから変換候補を探すものであってもよい。
In the first to seventh embodiments, the
この場合は、図23に示すように、サーバ100のCPU110は、受信したデータからテキストデータを読み出す(ステップS104B)。すなわち、この時点で、CPU110は、音声入力された言葉のカナのデータを取得したことになる。
In this case, as shown in FIG. 23, the
その後のステップS106〜ステップS128の処理は、第1の実施の形態のそれと同様であるため、ここでは説明を繰り返さない。 Since the subsequent processing of step S106 to step S128 is the same as that of the first embodiment, description thereof will not be repeated here.
そして、CPU110は、通信インターフェイス160を介して、作成したテキストデータを電気機器300に送信する(ステップS134)。このとき、電気機器300のCPU310は、サーバ100から受信したテキストデータを音声データに変換して、スピーカ370に出力させる。そして、サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からの回答を待ち受ける。その後の処理は、第1の実施の形態のそれと同様であるため、ここでは説明を繰り返さない。
<第9の実施の形態>
Then,
<Ninth embodiment>
第1から第7の実施の形態においては、日本語の音声が入力され、当該音声から認識されたカナを漢字に変換するための構成について説明した。しかしながら、ネットワークシステム1は、英語や他の言語の音声が入力され、当該音声をアルファベットなどの文字に変換または認識するものであってもよい。 In the first to seventh embodiments, the configuration for inputting Japanese speech and converting kana recognized from the speech into kanji has been described. However, the network system 1 may receive English or other language voices and convert or recognize the voices to characters such as alphabets.
図24を参照して本実施の形態にかかるネットワークシステム1の動作概要について説明する。まず、図24(A)に示すように、電気機器300がサーバ100からの指令に基づいて、ユーザに氏名などの単語の音声入力を促す。図24(B)に示すように、ユーザは、たとえば英語の氏名を入力する。
An outline of the operation of the network system 1 according to the present embodiment will be described with reference to FIG. First, as illustrated in FIG. 24A, the
すると、電気機器300は、入力された音声データをサーバ100に送信する。サーバ100は、音声データからアルファベットの候補を特定し、当該候補が含まれる単語を検索する。サーバ100は、単語の音声データを電気機器300に送信する。図24(C)に示すように、電気機器300は、当該単語を音声出力して、システムが特定したアルファベットがユーザが考えているものと同じであるか否かをユーザに尋ねる。
Then, the
図24(D)に示すように、当該質問にユーザが肯定的な回答を返すと、電気機器300は、その旨をサーバ100に送信する。サーバ100は、データベースから残りの音声データのアルファベットの候補を特定し、当該候補が含まれる単語を検索する。
As shown in FIG. 24D, when the user returns a positive answer to the question, the
次に、図25を参照しながら、本実施の形態にかかるサーバ100における情報処理について説明する。サーバ100のCPU110は、通信インターフェイス160を介して、電気機器300からデータを受信すると以下の処理を実行する。
Next, information processing in the
CPU110は、受信したデータから音声データを取得する(ステップS302)。CPU110は、音声データを対象言語の文字列に変換する(ステップS304)。
CPU110 acquires audio | voice data from the received data (step S302). The
CPU110は、辞書を参照して、入力された音声データに対応する複数の文字のデータに全文一致する単語を検索する(ステップS306)。CPU110は、入力されたアルファベットに全文一致する単語が見つかった場合(ステップS310においてYESである場合)、CPU110は、変換候補として当該単語を提示するためのテキストデータを作成する(ステップS322)。この場合は、辞書の説明を利用してもよい。たとえば、「America大陸のAmericaですか?」というテキストデータを作成する。CPU110は、ステップS330からの処理を実行する。
一方、CPU110は、変換した文字列のデータに全文一致する単語がみつからなかった場合(ステップS310においてNOである場合)、辞書を参照して、当該文字列の一部にその一部が一致する単語を検索する(ステップS320)。そして、CPU110は、当該文字列の一部の変換候補として単語を提示するためのテキストデータを作成する。たとえば、「AmericaのAですか?」というテキストデータを作成する(ステップS328)。
On the other hand, when a word that matches the whole sentence is not found in the converted character string data (NO in step S310),
CPU110は、ユーザ音声のうちに、対応する文字が確定していないものが未だ残っているか否かを判断する(ステップS330)。CPU110は、ユーザ音声の一部に対応する文字が確定していないものが未だ残っている場合(ステップS330においてYESである場合)、当該未だ確定していない文字に対して、ステップS306からの処理を繰り返す。
入力音声に対する全ての文字が確定すると(ステップS330においてNOである場合)、CPU110は、作成したテキストデータを組み合わせる(ステップS331)。CPU110は、組み合わせたテキストデータを音声データに変換する(ステップS332)。CPU110は、通信インターフェイス160を介して、音声データを電気機器300に送信する(ステップS334)。CPU110は、通信インターフェイス160を介して、電気機器300からの回答を待ち受ける。
When all the characters for the input voice are confirmed (NO in step S330),
CPU110は、通信インターフェイス160を介して、電気機器300から肯定的な回答を受け付けると(ステップS336においてYESである場合)、ステップS334で送信した複数の文字の候補が正しかったとして文字列を確定する(ステップS340)。CPU110は通信インターフェイス160を介して次の電気機器300からのデータを待ち受ける。
When
また、CPU110は、通信インターフェイス160を介して、電気機器300から否定的な回答を受け付けた場合(ステップS336においてNOの後、ステップS338においてYESである場合)、ステップS304からの処理を繰り返す。ただし、このとき、CPU110は、音声データの再取得を電気機器300に要求してもよい。
<第10の実施の形態>
When
<Tenth Embodiment>
なお、第1から第9の実施の形態のような、サーバ100や電気機器300の構造・機能・動作に限られず、各装置の役割が、他のサーバやデータベースなどの複数の装置に分担されてもよい。逆に、複数の装置の役割の一部または全部が1つの装置に集約されてもよい。
Note that the role of each device is not limited to the structure, function, and operation of the
たとえば、図26に示すように、第1から第9の実施の形態にかかるサーバ100の役割の全部を、スタンドアローン型の電気機器300が有してもよい。まず、図26(A)に示すように、電気機器300が、ユーザに名前の音声入力を促す。図26(B)に示すように、ユーザが氏名を話す。
For example, as shown in FIG. 26, the stand-alone
すると、電気機器300は、入力された音声データに基づいて、データベースから氏名の全部を含む有名人を検索する。電気機器300は、氏名の全部を含む氏名を有する有名人が見つからない場合、データベースから名字の全てを含む氏名を有する有名人を検索する。同じ名字の有名人を見つけると、図26(C)に示すように、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名字が当該有名人の名字と同じであるか否かをユーザに尋ねる。
Then, the
図26(D)に示すように、当該質問にユーザが肯定的な回答を返すと、電気機器300、データベースから氏名の残りの部分を含む氏名を有する有名人を検索する。電気機器300は、データベースから、名前の一部が同じ有名人を検索する。一部が同じ名前の有名人を見つけると、電気機器300は、当該有名人の氏名を音声出力して、ユーザの名前が当該有名人の名前の一部と同じであるか否かをユーザに尋ねる。
As shown in FIG. 26D, when the user returns a positive answer to the question, the celebrity having the name including the remaining part of the name is searched from the
なお、図2と同様に、ユーザが電気機器300からのメッセージに質問に否定的な回答を返した場合は、電気機器300は、データベースからユーザの氏名の一部のカナに対応する別の漢字を含む名前を有する別の有名人を検索する。該当する別の有名人を見つけると、電気機器300は、当該別の有名人の氏名を音声出力して、ユーザの名字が当該別の有名人の名字と同じであるか否かをユーザに尋ねる。
Similarly to FIG. 2, when the user returns a negative answer to the question from the message from the
次に、図27を参照しながら、本実施の形態にかかる電気機器300における情報処理について説明する。電気機器300のCPU310は、マイク380を介して音声データを取得する(ステップS402)。CPU310は、音声データをテキストに変換する(ステップS404)。すなわち、この時点で、CPU310は、音声入力された言葉のカナのデータを取得したことになる。
Next, information processing in the
CPU310は、有名人辞書を参照して、入力された氏名のカナのデータに全文一致する氏名を有する有名人を検索する(ステップS406)。CPU310は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいた場合(ステップS410においてYESである場合)、CPU310は、ユーザの氏名の変換候補として当該有名人の名前を提示するためのテキストデータを作成する(ステップS422)。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうは、芸能人の竹内太郎と同じですか?」というテキストデータを作成する。CPU310は、ステップS432からの処理を実行する。
The
一方、CPU310は、入力された氏名のカナのデータに全文一致する氏名を有する有名人がいなかった場合(ステップS410においてNOである場合)、有名人辞書を参照して、入力された氏名の一部のカナに一部一致する氏名を有する有名人を検索する(ステップS420)。そして、CPU310は、ユーザの氏名の一部の変換候補として当該有名人の氏名を提示するためのテキストデータを作成する。たとえば、ユーザが「たけうちたろう」という音声を入力していた場合には、「たけうちたろうのたけは、芸能人の武田次郎の武ですか?」というテキストデータを作成する(ステップS428)。
On the other hand, if there is no celebrity having a full name that matches the full text of the input name data (if NO in step S410),
CPU310は、作成したテキストデータの音声データを作成する(ステップS432)。CPU310は、当該音声データに基づいて、スピーカ370に、音声メッセージを出力させる(ステップS434)。
CPU310は、マイク380を介してユーザから肯定的な回答を受け付けると(ステップS436においてYESである場合)、ステップS434で出力した変換候補が正しかったとしてユーザの氏名の全部または一部のカナに対応する漢字を確定する(ステップS440)。CPU310は、ユーザの氏名のカナのうちに、対応する漢字が確定していないものが未だ残っているか否かを判断する(ステップS442)。ユーザの氏名のカナの全ての対応する漢字が確定すると(ステップS442においてNOである場合)、CPU310は通信インターフェイス160を介して次の電気機器300からのデータを待ち受ける。
When
CPU310は、ユーザの氏名のカナのうちに、対応する漢字が確定していないものが未だ残っている場合(ステップS442においてYESである場合)、当該未だ確定していないカナに対して、ステップS406からの処理を繰り返す。
If there is still a kana character for which the corresponding kanji character has not been confirmed among the kana characters of the user name (YES in step S442),
また、CPU310は、マイク380を介して、ユーザから否定的な回答を受け付けた場合(ステップS436においてNOの後、ステップS438においてYESである場合)も、当該未だ確定していないカナに対して、ステップS406からの処理を繰り返す。なお、この場合は、ステップS406やステップS420において、CPU310は、ステップS434で出力した候補以外の有名人から当該カナに一致する漢字を含む氏名を有する有名人を選択する。
<その他の応用例>
<Other application examples>
本発明は、システム或いは装置にプログラムを供給することによって達成される場合にも適用できることはいうまでもない。そして、本発明を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体(あるいはメモリ)を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の効果を享受することが可能となる。 It goes without saying that the present invention can also be applied to a case where it is achieved by supplying a program to a system or apparatus. Then, a storage medium (or memory) storing a program represented by software for achieving the present invention is supplied to the system or apparatus, and the computer (or CPU or MPU) of the system or apparatus stores it in the storage medium. The effect of the present invention can also be enjoyed by reading and executing the program code.
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) running on the computer based on the instruction of the program code However, it is needless to say that a case where the function of the above-described embodiment is realized by performing part or all of the actual processing and the processing is included.
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わる他の記憶媒体に書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, after the program code read from the storage medium is written to another storage medium provided in the function expansion board inserted into the computer or the function expansion unit connected to the computer, based on the instruction of the program code, It goes without saying that the CPU of the function expansion board or function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
1 :ネットワークシステム
100 :サーバ
110 :CPU
120 :メモリ
121 :有名人辞書
122 :有名人辞書
123 :歴史有名人物辞書
124 :地名辞書
125 :ユーザ情報テーブル
140 :操作部
160 :通信インターフェイス
300 :電気機器
300A :ロボット
310 :CPU
320 :メモリ
330 :ディスプレイ
340 :操作部
350 :カメラ
360 :通信インターフェイス
370 :スピーカ
380 :マイク
390 :機器駆動部
1: Network system 100: Server 110: CPU
120: memory 121: celebrity dictionary 122: celebrity dictionary 123: history celebrity dictionary 124: place name dictionary 125: user information table 140: operation unit 160: communication interface 300:
320: Memory 330: Display 340: Operation unit 350: Camera 360: Communication interface 370: Speaker 380: Microphone 390: Device drive unit
Claims (9)
前記音声の文言に対応する漢字の変換候補を前記端末に音声出力させるサーバと、を備えるネットワークシステム。 A terminal that accepts audio,
And a server that causes the terminal to output a kanji conversion candidate corresponding to the speech word.
前記端末またはサーバが音声を文言に変換するステップと、
前記サーバが前記文言に対応する漢字の変換候補を選択するステップと、
前記端末が前記変換候補の音声を出力するステップと、を備える情報処理方法。 A step in which the terminal receives audio;
The terminal or server converting speech to text;
The server selecting a kanji conversion candidate corresponding to the wording;
A step of outputting the voice of the conversion candidate by the terminal.
前記文言に対応する漢字の変換候補を選択し、前記通信インターフェイスを介して前記端末に当該変換候補を送信するためのプロセッサと、を備えるサーバ。 A communication interface for receiving voice or wording data from the terminal;
A server comprising: a processor for selecting a Kanji conversion candidate corresponding to the wording and transmitting the conversion candidate to the terminal via the communication interface.
前記プロセッサが、前記文言に対応する漢字の変換候補を選択するステップと、
前記プロセッサが、前記通信インターフェイスを介して前記端末に当該変換候補を送信するステップと、を備えるサーバにおける情報処理方法。 A processor receiving voice or wording data from a terminal via a communication interface;
The processor selecting a kanji conversion candidate corresponding to the word;
A step of transmitting the conversion candidate to the terminal via the communication interface;
スピーカと、
前記マイクを介して音声を受け付け、当該音声の文言に対応する漢字の変換候補を選択し、当該変換候補を前記スピーカに出力させるためのプロセッサと、を備える端末。 With a microphone,
Speakers,
A terminal comprising: a processor for receiving voice through the microphone, selecting a conversion candidate for kanji corresponding to the wording of the voice, and causing the speaker to output the conversion candidate.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017030794A JP2018136740A (en) | 2017-02-22 | 2017-02-22 | Network system, information processing method, server and terminal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017030794A JP2018136740A (en) | 2017-02-22 | 2017-02-22 | Network system, information processing method, server and terminal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018136740A true JP2018136740A (en) | 2018-08-30 |
Family
ID=63365522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017030794A Pending JP2018136740A (en) | 2017-02-22 | 2017-02-22 | Network system, information processing method, server and terminal |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018136740A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022085474A1 (en) * | 2020-10-20 | 2022-04-28 | パナソニックIpマネジメント株式会社 | Information processing method |
-
2017
- 2017-02-22 JP JP2017030794A patent/JP2018136740A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022085474A1 (en) * | 2020-10-20 | 2022-04-28 | パナソニックIpマネジメント株式会社 | Information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107370649B (en) | Household appliance control method, system, control terminal and storage medium | |
CN114303132B (en) | Method and system for context association and personalization using wake words in a virtual personal assistant | |
KR102429436B1 (en) | Server for seleting a target device according to a voice input, and controlling the selected target device, and method for operating the same | |
JP6817803B2 (en) | How to send and receive messages, devices, and computer programs | |
US10749989B2 (en) | Hybrid client/server architecture for parallel processing | |
US20190164064A1 (en) | Question and answer interaction method and device, and computer readable storage medium | |
WO2017112813A1 (en) | Multi-lingual virtual personal assistant | |
US20140122407A1 (en) | Chatbot system and method having auto-select input message with quality response | |
CN101243437A (en) | Virtual robot communication format customized by endpoint | |
US10579727B2 (en) | Hybrid grammatical and ungrammatical parsing | |
JP6120927B2 (en) | Dialog system, method for controlling dialog, and program for causing computer to function as dialog system | |
JP2019532376A (en) | Candidate item presentation method and terminal device | |
JP6178208B2 (en) | Question field judgment device and question field judgment method | |
JP2019008783A (en) | Method and system for expansion to everyday language by using word vectorization technique based on social network content | |
US20200081975A1 (en) | System and method for dynamic trend clustering | |
JP6306376B2 (en) | Translation apparatus and translation method | |
US8856010B2 (en) | Apparatus and method for dialogue generation in response to received text | |
JP2018136740A (en) | Network system, information processing method, server and terminal | |
JPWO2018179373A1 (en) | Conversation support device, conversation support method, and program | |
JP2009163358A (en) | Information processor, information processing method, program, and voice chat system | |
CN113678119A (en) | Electronic device for generating natural language response and method thereof | |
CN112219235A (en) | System comprising an electronic device for processing a user's speech and a method for controlling speech recognition on an electronic device | |
CN111552794B (en) | Prompt generation method, device, equipment and storage medium | |
JP2018151922A (en) | Server, information processing method, network system, and terminal | |
JP2014109998A (en) | Interactive apparatus and computer interactive method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201007 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210330 |