JP4496015B2 - 携帯電話機 - Google Patents

携帯電話機 Download PDF

Info

Publication number
JP4496015B2
JP4496015B2 JP2004168984A JP2004168984A JP4496015B2 JP 4496015 B2 JP4496015 B2 JP 4496015B2 JP 2004168984 A JP2004168984 A JP 2004168984A JP 2004168984 A JP2004168984 A JP 2004168984A JP 4496015 B2 JP4496015 B2 JP 4496015B2
Authority
JP
Japan
Prior art keywords
voice
mobile phone
unit
information
push
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2004168984A
Other languages
English (en)
Other versions
JP2005348364A (ja
Inventor
慎二 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Priority to JP2004168984A priority Critical patent/JP4496015B2/ja
Publication of JP2005348364A publication Critical patent/JP2005348364A/ja
Application granted granted Critical
Publication of JP4496015B2 publication Critical patent/JP4496015B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、携帯電話機に関し、特に音声認識を利用して発呼操作を簡略化する場合の改良に関する。
音声認識による発呼機能(Voice Dial機能と呼ばれる)は、キー入力の煩わしさからユーザを解放する機能であり、現在、携帯電話機の海外向けモデルを中心に採用されている。
Voice Dial機能は、音声辞書に基づき実行される。音声辞書は、電話番号のそれぞれに、照合用の音声パターンを対応付けることで構成される。
Voice Dial機能付きの携帯電話機は、発呼にあたってユーザに発声を求め、ユーザが発声すれば、音声辞書の音声パターンのうち、ユーザが発した音声パターンに最も近いものを特定する。そのようにして特定した音声パターンに対応付けられた電話番号を用いて、発呼を行うのである。
Voice Dial機能付きの携帯電話機に関しては、以下の特許文献1に記載された先行技術がある。この特許文献1に記載された先行技術は、通信相手の名前を読み上げる音声入力を受け付け、音声辞書から、この入力音声に対応する電話番号を呼び出す。そして「発呼」という音声をユーザが発すれば、その電話番号にて発呼を行うというものである。
特開平11-112633号公報
しかしながら従来の音声辞書の構造は、照合される音声パターンと、それぞれの電話番号を対応させる構造、つまり音声パターンと電話番号とを1対1に対応させる構造を有している。そのため、電話番号を1つ追加する度に、見出し語となる音声パターンを音声辞書に登録せねばならない。この見出し語となる音声パターンは、電話番号と比較してデータサイズが大きいので、携帯電話機に内蔵された不揮発メモリなら30件程度の登録数が限界になってしまう。
本発明の目的は、音声パターンの数の増加を最小限に留めながらも、電話番号の登録数を増やすことができる携帯電話機を提供することである。
上記課題を達成するため、本発明に係る携帯電話機は、音声を認識して通信を行う携帯電話機であって、音声情報を記憶し、更に第1の電話帳及び第2の電話帳を記憶する記憶手段と、ユーザが発した音声に対し、記憶手段に記憶された音声情報に基づく認識処理を行い、通信相手を特定する認識手段と、特定された通信相手との通信を行う通信手段とを備え、音声情報には、主たる見出し語の音声パターン、及び、従たる見出し語の音声パターンのそれぞれが記述されており、従たる見出し語には、ネットワークにおけるサーバ装置を介した通信機能を呼び出すための特定の音声パターンがあり、前記サーバ装置を介した通信機能とは、グループに属する各人の情報をサーバ装置に管理させておいて、グループに属する複数人との同時通信を行う機能であり、前記第1の電話帳は、携帯電話機のユーザによって個人的に管理されている情報によって構成され、前記第2の電話帳は、サーバ装置で管理されている情報の一部であり、サーバ装置を介した通信機能における通信相手の情報を、主たる見出し語に対応づけて示し、前記認識手段は、前記通信機能を呼び出すための特定の音声パターンを認識した際、第2の電話帳における通信相手の情報を用いて通信相手を特定することを特徴としている。
本発明の携帯電話機は、音声辞書を記憶し、更に第1の電話帳及び第2の電話帳を記憶する記憶手段と、ユーザが発した音声に対し、記憶手段に記憶された音声辞書に基づく認識処理を行い、通信相手を特定する認識手段と、特定された通信相手との通信を行う通信手段とを備え、音声辞書には、主たる見出し語の音声パターン、及び、従たる見出し語の音声パターンのそれぞれが複数記述されており、主たる見出し語と、従たる見出し語との組合せにより第1の電話帳又は第2の電話帳から通信相手の情報を特定している。主たる見出し語をn個、従たる見出し語をm個とした場合、n+m個の音声パターンを記憶手段に記憶させておくことで、n×m個の通信相手の情報を記憶手段に記憶させておくことができる。ここで従たる見出し語の数が多ければ多いほど、電話番号等通信相手の数は増すため、多くの友人や会社の同僚の電話番号等を登録しておくことができる。
ここで前記認識手段は、主たる見出し語の何れかを読み上げた音声入力を受け付ける第1受付部と、従たる見出し語の何れかを読み上げた音声入力を受け付ける第2受付部と、主たる見出し語のうちその音声パターンが、第1受付部により受け付られけた音声に最も近いものを特定する第1特定部と、従たる見出し語のうちその音声パターンが、第2受付部により受け付けられた音声に最も近いものを特定する第2特定部とを有し、
前記認識手段が特定する通信相手は、第1特定部が特定した主たる見出し語と、第2特定部が特定した従たる見出し語との組合せから一意に定まる通信相手であってもよい。
主たる見出し語の1つを発声した音声入力を、従たる見出し語の1つを発声した音声とは別に受け付けるので、主たる見出し語の音声入力と、従たる見出し語の音声入力との混同がなくなり、認識率を高めることができる。
以降、本発明に係る携帯電話機の実施形態について、携帯電話機を一例にして説明する。本実施形態に係る携帯電話機の特徴としては、Push To Talk通話の機能を具備している点である。Push To Talk通話とは、複数人との同時通話を実現する機能である。ここで複数人と通話を行う度に複数人を選択して発呼するのは、ユーザにとって煩雑であり、また複数人分のデータのやりとりにネットワーク上での伝送遅延があるため、即時性が失われる。
これらを避けるには、予め同時通話を行いたい複数人のグループと、グループに属する各個人のデータ(名前、電話番号等)とをサーバ装置に管理させておくことが望ましい。何故なら、同時通話にあたってそのグループさえ特定すれば、通話の相手先を全て特定することができるからである。
グループに関するデータを、サーバ装置で管理させる場合、今度は携帯電話機−サーバ装置間の通信が問題になる。グループに属する個人名のリストや、詳細を携帯電話機に表示させる度に、サーバ装置をアクセスするとなると、サーバ装置のアクセスが殺到するので、待ち時間が生じ即時性が失われるからである。そこで携帯電話機は、サーバ装置に要求を発することにより、グループに関するデータをサーバ装置からダウンロードする。こうしてダウンロードされたデータをPush To Talk用電話帳という。サーバ装置上のデータは、恒常的なものではなく不定期に更新されうる。何故なら、かかる更新はサーバ装置を利用する不特定多数の者が、特定のWebページに対しログイン入力を行い、編集操作を行うことで、不定期になされるからである。サーバ装置上のデータに変動があるので、サーバ装置上にあってPush To Talk用電話帳にないデータを補うため携帯電話機は、適当な頻度でサーバ装置からのダウンロードを行う。頻繁なダウンロードにより携帯電話機は、自身が保持しているPush To Talk用電話帳を絶えず最新のものにする。逆に携帯電話機でPush To Talk用電話帳を変更した場合は、携帯電話機において変更が施されたPush To Talk用電話帳をサーバ装置にアップロードする。
Push To Talk用電話帳と、携帯電話機が本来持っている電話帳との区別について説明する。後者の電話帳は、電子手帳のように個人的なデータを管理する役割があり、様々な携帯電話サービスのプロバイダ(会社法人)により、様々な付加機能が提供される。例えば個人データ一人当たりに対して家庭用、仕事用、携帯用等の複数の電話番号を電話帳に持たせたり、電子メールのアドレスを管理させたりするといった機能が代表的である。
これに対し前者のPush To Talk用電話帳は、Push To Talk通話に必要最低限なデータを管理するものであり、携帯電話のプロバイダが共通して扱われるデータ構造をもっている。つまり各プロバイダ毎に、データ構造が変わることは有り得ない。こうした観点からPush To Talk用電話帳は、電話帳と区別されることになる。以上がPush To Talk通話についての説明である。続いて携帯電話機の内部構成について説明する。
図1は、本実施形態に係る携帯電話機の内部構成を示す図である。図1に示すように携帯電話機はBB信号処理部1、RF信号処理部2、操作部3、表示部4、集音部5、音声辞書記憶部6(名前テーブル7、ラベルテーブル8、音声発呼用電話帳9、Push To Talk発呼用電話帳10)、VoiceDial記憶部11、制御部12からなる。
BB信号処理部1は、BB(ベースバンド)信号に対する送受信処理を行う。携帯電話機の発信時においてBB信号処理部1は、制御部12の制御に基づき送信処理を行い、BB信号をRF信号処理部2に出力する。携帯電話機の着信時においてBB信号処理部1は、RF信号処理部2から出力されたBB信号に対して受信処理を行ってデジタルデータを得て制御部12に出力する。
RF信号処理部2は、BB信号−RF(高周波)信号の変換処理を行う。発信時においてRF信号処理部2はBB信号処理部1により出力されたBB信号をRF信号に変換し、増幅した上で送信出力する。着信時においてRF信号処理部2はアンテナから入力されてくるRF信号を増幅し、BB信号に変換してBB信号処理部1に出力する。これらBB信号処理部1、RF信号処理部2により、通話信号の発信又は着信、通話データの発信又は着信がなされる。
操作部3は、数値キー3a、オンフックキー3b、オフフックキー3c、Voice Dial機能呼出しキー3dからのユーザ操作を受け付ける。携帯電話機の筐体において、これら操作部3のキーがどのように配置されているかを図に示す。図2は、携帯電話機の外観を示す図であり、本図に示すように、数値キー3a、オンフックキー3b、オフフックキー3c、Voice Dial機能呼出しキー3dは、片手で押下されるよう配置が工夫されている。
表示部4は、LCDであり、音声辞書に登録されている名前やラベル、電話番号を視覚化して表示する。図2において表示部4には、5つの名前(AAA、BBB、CCC、DDD、EEE)が一覧表示されている。表示部4による視覚化により、音声辞書にどんな名前やラベル、電話番号が登録されているかを知ることができる。
集音部5は、マイク、A/Dコンバータを備え、マイクから入力された音声をA/D変換して、音声データとして制御部12に出力する。
音声辞書記憶部6は、不揮発メモリであり、音声辞書を記憶している。
名前テーブル7は、音声辞書の一要素であり、名前の音声パターンを複数配してなる。図3(a)は、名前テーブル7の一例を示す図である。図3(a)に示すように名前テーブル7は、名前のID(名前A,B,C,D,E)と、名前を読み上げた際の音声パターン(音声パターンA,B,C,D,E)との組みから構成される。図3(a)の一例において、音声パターンA,B,C,D,Eは、それぞれAAA、BBB、CCC、DDD、EEEといった人名を読み上げた音声パターンであり、これらは名前A,B,C,D,EといったIDと組みになって不揮発メモリ7に登録されている。
ラベルテーブル8は、音声辞書の一要素であり、ラベルの音声パターンを複数配してなる。図3(b)は、ラベルテーブル8の一例を示す図である。図3(b)に示すように複数のラベル(H(自宅の電話番号),W(職場の電話番号),M(携帯電話の番号)・・・・・)と、音声パターン(音声パターン1,2,3,4,5,6,7)との組みから構成される。ラベルとは名前の属性を示す情報であり、図3(b)の一例において、音声パターン1,2,3,4,5,6は、それぞれ自宅の電話番号、職場の電話番号、携帯電話の番号、ページャの番号、Data端末の番号等を意味するラベルを読み上げた音声パターンであり、ラベルのIDと組みになって登録されている。
音声発呼用電話帳9は、音声辞書の一要素であり、ユーザ各人についての電話帳を複数配してなるアドレス帳である。Push To Talk用電話帳、携帯電話機が本来持っている電話帳といった分類からすれば、この音声発呼用電話帳9は、後者の電話帳にあたる。図4(a)は、ユーザAAA,BBB,CCCについての電話帳を配することにより構成される音声発呼用電話帳9の一例を示す図である。図5は、図4(a)の音声発呼用電話帳9のうち、ユーザAAAの電話帳を抜き出して示す。本図に示すように、電話帳は、ユーザの名前AAAに、複数の通信相手の情報(111-111-1111,111-222-2222,111-333-3333・・・という電話番号)を対応づけてなる。各電話番号には、H[Home],W[Work],M[Mobil],P[Pager],D[Data],F[Fax],[]([No Label])といったラベルが付加されている。これらラベルが付された電話番号は、001〜0077のメモリ番号にて一意に特定される。尚、通信相手の情報には、電話番号の他、ファックス番号、URL、E-mailアドレスといったものがあるが、説明の簡略化を期するため、通信相手の情報は、”電話番号”であるものとして説明を進める。
図6は、名前テーブル7における音声パターン、ラベルテーブル8における音声パターン、音声発呼用電話帳9における電話番号の対応関係を示す図である。名前テーブル7に、名前AAA,BBB,CCCの音声パターンが記述されている場合、これら名前AAA,BBB,CCCの音声パターン毎に、ラベルテーブル8における複数ラベルを定義することができる(図中の矢印cy1,2,3)。ここでラベルの数が4つ(自宅の電話番号、職場の電話番号、携帯電話機、fax番号)であるとする。名前テーブル7に記述された3つの名前のそれぞれに、これら4つのラベルを定義することができるので、矢印py1,2,3,4・・・・12に示すように、計12個(=3×4)の電話番号を音声辞書に登録しておくことができる。仮に音声辞書に登録すべき名前の数が3つであり、ラベルの数が4つであるものとする。この場合、7個(=3+4)の音声パターンを音声辞書に登録しさえすれば、12個(=3×4)の電話番号を音声辞書にできるので、音声パターンの登録数を増やすことなく、多くの電話番号を登録しておくことができる。
Push To Talk用電話帳10は、音声辞書の一要素であり、Push To Talkシステムでの通話にあたっての通信相手の電話番号を、相手側の名前と対応づけて示すアドレス帳である。Push To Talk用電話帳、携帯電話機が本来持っている電話帳といった分類からすれば、この音声発呼用電話帳9は、前者の電話帳にあたる。このPush To Talk用電話帳10に対する管理は、音声辞書に対する管理と別になっている。つまり音声辞書は、携帯電話機により管理されているのに対し、Push To Talk用電話帳10はサーバ装置にて管理され、携帯電話機はその写しを保持しているに過ぎない。図4(b)は、Push To Talk用電話帳10のうち、ユーザAAAのPush To Talk用電話帳10の一例を示す図である。本図に示すように、一ユーザについての電話帳は、1つの電話番号しか登録できない。電話番号の登録数を1つにしているのは、Push To Talk用電話帳10では、同じメモリ番号に複数の電話番号が割り当てられるというメモリ番号の重複が出現するからである。例えば、携帯電話機が圏外にある際、ユーザが、ユーザAAAについてのPush To Talk用電話帳10にメモリ番号1を割り当てて、1つの電話番号を追加したとする。一方、WEBサーバ側でも、同じユーザAAAについてのPush To Talk用電話帳16に、メモリ番号1を割り当てて電話番号を追加したとする。その後、この携帯電話機が圏内に入り、WEBサーバからPush To Talk用電話帳10をダウンロードすると、同じユーザについてのPush To Talk用電話帳10のメモリ番号1に、2つの電話番号が登録されてしまう。Push To Talk用電話帳10において名前と、電話番号との対応関係を1対1にすることにより、かかる重複を防止している。
Push To Talk電話帳への登録には、
1.手入力
2.音声発呼用電話帳9からのコピー
3.WEBサーバからのダウンロード
図7は、Push To Talk用電話帳10への登録がどのように行われるかを示す図である。本図においてユーザAAAの電話番号111-333-3333は、「2.音声発呼用電話帳9からのコピー」にて登録された電話番号である。これは、WEBサーバへのアップロードのためのものである。ユーザBBBの電話番号222-888-888は、「1.手入力」にて登録された電話番号である。ユーザBBBの電話番号として適当な番号が入力されている。
ユーザCCCからユーザEEEの電話番号は、「3.WEBサーバからのダウンロード」にて登録された電話番号であり、Push To Talk用電話帳10のみに存在している。
図8は、Push To Talk用電話帳10の検索がどのように行われるかを示す図である。図中の矢印キーは、かかる検索の経緯を示す。例えば、矢印キーSh1は、AAAという名前が音声入力され、Push To Talkというラベルが指定された場合の検索の経緯であり、この検索により111-333-3333という電話番号がPush To Talk用電話帳10から読み出される。矢印キーSh2は、BBBという名前が音声入力され、Push To Talkというラベルが指定された場合の検索の経緯であり、この検索により222-888-8888とおいう電話番号がPush To Talk用電話帳10から読み出される。矢印キーsh3は、DDDという名前が音声入力され、Push To Talkというラベルが指定された場合の検索の経緯である。Push To Talk用電話帳10における電話番号が変更されたとしても、Push To Talk発呼用電話帳10における名前さえ同一であれば、絶えず変更後の電話番号を用いて発信が行なえる。
VoiceDial記憶部11は、VoiceDialが行われる度に、音声認識の結果を格納する。図9は、VoiceDial記憶部11の保持内容の一例を示す図である。本図に示すように音声認識された名前AAAと、音声認識されたラベルに対応するメモリ番号001とを一時的に保持する。
制御部12は、操作部3に対するユーザ操作に基づき、BB信号処理部1、高周波信号処理部2に対する発呼制御及び着呼制御や音声辞書に対するアクセスを行う。携帯電話機における発呼にあたって制御部12は、ユーザが発声した音声の音声データを集音部5から受け取り、音声辞書記憶部6に記憶された音声辞書に基づく認識処理を行って、発呼先となる通信相手を特定する。この制御部12による制御内容は、コンピュータ読取可能なプログラムを、CPUが実行することで実現される。このプログラムは、図10、図11、図13に示すフロ−チャ−トの処理手順を、コンピュータ記述言語で記述することにより作成される。以降、図10、図11、図13の処理手順について説明する。本フローチャートの説明は、図12、図14を引用しながら行う。図12は、Voice Dial機能の実行時における表示部4の表示内容を示す図であり、図14は、音声辞書の時における表示部4の表示内容を示す図である。
図10のフローチャートにおけるステップS1、ステップS2、ステップS3はメインルーチンにあたる処理であり、待ち受け状態であるか、音声辞書の指示がなされたか、Voice Dial機能の指示がなされたかの操作を受け付ける。
Voice Dial機能の指示がなされれば、音声辞書における名前を一覧表示し、どれかの名前を読み上げるようガイダンス表示し(ステップS4)、マイクに対する音声入力を受け付ける(ステップS5)。図12の画面h1は、ステップS4の実行時に表示部4に表示される画面の一例である。この画面h1に示すように、音声辞書における複数氏名がユーザに提示されて音声入力がなされるのを待つ。ユーザが発声を行えば、音声辞書における名前のうち、音声パターンが入力音声に最も近いものを名前iに設定する(ステップS6)。近い音声パターンが存在しない場合は(ステップS7でyes)、エラー表示を行う(ステップS17)。
最も近い音声パターンがあれば、相手先のラベルを一覧表示し、どれかのラベルを読み上げるようガイダンス表示を行い(ステップS8)、音声入力を受け付ける(ステップS9)。図12の画面h2は、ステップS8の実行時に表示部4に表示される画面の一例である。この画面h2に示すように、音声辞書における複数のラベルがユーザに提示されて音声入力がなされるのを待つ。
ユーザが発声を行えば、音声辞書におけるラベルのうち、音声パターンが入力音声に最も近いものをラベルjに設定する(ステップS10)。ラベルjが[Home]〜[No Label]の何れかならば、音声辞書に登録された複数電話番号のうち、名前i、ラベルjの組合せに対応するものを電話番号kとし(ステップS12)、電話番号kを用いて発呼を行う(ステップS13)。図12の画面h3は、ステップS13における発呼中に表示部4に表示される画像を示す。
ラベルjが[Home]〜[No Label]の何れにもあたらないが(ステップS11でNo)、ラベルjが[Push To Talk]であるなら(ステップS14でYes)、ステップS15において名前iに一致する電話番号をPush To Talk用電話帳10から検索する。もし存在するなら(ステップS15でYes)、Push To Talk用電話帳10のうち、名前iに一致する電話番号で発呼を行う(ステップS16)。
ステップS7でNo、ステップS14でNo、ステップS15で「無し」と判定された場合、エラー表示を行う(ステップS17)。
音声辞書登録をユーザが選択した場合、音声辞書における名前を一覧表示し(ステップS21)、電話番号を追加したい相手側は音声辞書に存在するかをユーザに問い合わせる(ステップS22)。図14の画面h4は、ステップS21において表示部4に表示される画面の一例である。この画面h4に示すように、音声辞書における複数の名前がユーザに提示されるのである。
もし存在すれば、電話番号を追加したい名前を名前uに設定し(ステップS23)、ラベルを一覧表示する(ステップS24)。ここでの一覧表示は、名前uとの組合せに電話番号が登録されているラベルを除いたものである。図14の画面h5は、ステップS24において表示部4に表示される画面の一例である。電話番号を追加すべきAAA氏の自宅の電話番号が登録済みである場合(ステップS22でYES)、この画面h5に示すように、自宅の電話番号を除く複数のラベルがユーザに提示される。
その後、すべきラベルを読み上げるようガイダンス表示を行い(ステップS25)、音声入力を受け付ける(ステップS26)。ここで受け付けたラベルをラベルvとして(ステップS27)、名前uと、ラベルvとの組合せに対応させるべき、電話番号を入力するようガイダンス表示を行う(ステップS28)。その後、電話番号のキー入力を受け付けて(ステップS29)、入力された電話番号を、名前uと、ラベルvとの組合せに対応づけて音声辞書に登録する(ステップS30)。図14の画面h6は、ステップS28において表示部4に表示される画面の一例である。この画面に従い、数値キーで電話番号を押下すれば、AAA氏の職場の電話番号が登録されることになる。
追加したい相手側が存在しなければ(ステップS22でNo)、音声パターンとしてすべき音声を発するようガイダンス表示を行い(ステップS31)、音声入力と(ステップS32)、名前の文字入力と(ステップS33)を受け付ける。図14の画面h7は、ステップS31で表示される画面の一例である。
音声や名前が入力されれば、入力された音声を、名前uの音声パターンとして音声辞書に登録して(ステップS34)、音声辞書におけるラベルを一覧表示し(ステップS35)、ステップS26に合流する。図14の画面h8は、ステップS35で表示される画面の一例である。
図15は、本通信装置によるVoiceDialの過程を示す図である。本図では、『入力した音声』、『VoiceDial記憶部11』、『音声発呼用の電話帳』、『Push To Talk用の電話帳』のそれぞれを横並びに示している。
先ず、入力音声が『AAA+Home』である場合のVoiceDialの手順について説明する。かかる音声の発呼により、右向きの矢印y21に示すようにVoiceDialの管理情報として音声データAAAと、メモリ番号001とが格納される。これらにより音声発呼用電話帳9の検索がなされ、矢印y22に示すように、ユーザAAAのHomeの電話番号がPush To Talk用電話帳10から読み出されて発呼が行われる。
続いて入力音声が『BBB+Push To Talk』である場合のVoiceDialの手順について説明する。かかる音声の発呼により、右向きの矢印y23に示すようにVoiceDialの管理情報として音声データBBBと、メモリ番号002とが格納される。これらによりPush To Talk用電話帳10の検索がなされ、矢印y24に示すように、ユーザBBBの電話番号がPush To Talk用電話帳10から読み出されて発呼が行われる。
以上説明したように本実施形態によれば、主たる見出し語をn個、従たる見出し語をm個とした場合、n+m個の音声パターンを音声辞書記憶部6に記憶させておくことで、n×m個の通信相手の情報を不揮発メモリ7に記憶させておくことができる。ここで従たる見出し語の数が多ければ多いほど、電話番号等通信相手の数は増すため、多くの友人や会社の同僚の電話番号等を登録しておくことができる。
尚本実施形態では、主たる見出し語(名前)と、従たる見出し語(ラベル)の組合せ毎に電話番号を登録したが、3つ以上の見出し語の組合せ毎に電話番号を登録してもよい。
本発明は、不揮発メモリの大規模化を招くことなく、電話番号の登録件数を増やすことができるため、携帯電話機の製造業に利用される可能性がある。
携帯電話機の内部構成を示す図である。 携帯電話機の外観を示す図である。 (a)名前テーブル7の内容を示す図である。 (b)ラベルテーブル8の内容を示す図である。 (a)音声発呼用電話帳9の内容を示す図である。
(b)Push To Talk用電話帳10のうち、ユーザAAAのPush To Talk用電話帳10の一例を示す図である。
図4(a)の音声発呼用電話帳9のうち、ユーザAAAの電話帳を抜き出して示す。 名前テーブル7における音声パターン、ラベルテーブル8における音声パターン、電話番号の対応関係を示す図である。 Push To Talk用電話帳10への登録がどのように行われるかを示す図である。 Push To Talk用電話帳10の検索がどのように行われるかを示す図である。 VoiceDial記憶部11の保持内容の一例を示す図である。 Voice Dial機能時における処理手順を示す図である。 Voice Dial機能時における処理手順を示す図である。 Voice Dial機能の実行時における表示部4の表示内容を示す図である。 音声辞書登録時における処理手順を示す図である。 音声辞書の時における表示部4の表示内容を示す図である。 本通信装置によるVoiceDialの過程を示す図である。
符号の説明
1 BB信号処理部
2 RF信号処理部
3 操作部
4 表示部
5 集音部
6 音声辞書記憶部
7 名前テーブル
8 ラベルテーブル
9 音声発呼用電話帳
10 Push To Talk発呼用電話帳
11 VoiceDial記憶部
12 制御部

Claims (5)

  1. 音声を認識して通信を行う携帯電話機であって、
    音声情報を記憶し、更に第1の電話帳及び第2の電話帳を記憶する記憶手段と、
    ユーザが発した音声に対し、記憶手段に記憶された音声情報に基づく認識処理を行い、通信相手を特定する認識手段と、
    特定された通信相手との通信を行う通信手段とを備え、
    音声情報には、主たる見出し語の音声パターン、及び、従たる見出し語の音声パターンのそれぞれが記述されており、
    従たる見出し語には、ネットワークにおけるサーバ装置を介した通信機能を呼び出すための特定の音声パターンがあり、
    前記サーバ装置を介した通信機能とは、グループに属する各人の情報をサーバ装置に管理させておいて、グループに属する複数人との同時通信を行う機能であり、
    前記第1の電話帳は、携帯電話機のユーザによって個人的に管理されている情報によって構成され、
    前記第2の電話帳は、サーバ装置で管理されている情報の一部であり、サーバ装置を介した通信機能における通信相手の情報を、主たる見出し語に対応づけて示し、
    前記認識手段は、前記通信機能を呼び出すための特定の音声パターンを認識した際、第2の電話帳における通信相手の情報を用いて通信相手を特定する
    ことを特徴とする携帯電話機。
  2. 前記認識手段は、
    主たる見出し語の何れかを読み上げた音声入力を受け付ける第1受付部と、
    従たる見出し語の何れかを読み上げた音声入力を受け付ける第2受付部と、
    主たる見出し語のうちその音声パターンが、第1受付部により受け付られけた音声に最も近いものを特定する第1特定部と、
    従たる見出し語のうちその音声パターンが、第2受付部により受け付けられた音声に最も近いものを特定する第2特定部とを有し、
    前記認識手段が特定する通信相手は、
    第1特定部が特定した主たる見出し語と、第2特定部が特定した従たる見出し語との組合せから一意に定まる通信相手であり、
    前記携帯電話機は、第1受付部及び第2受付部が音声入力をユーザから受け付けるのに先立ち、主たる見出し語の一覧、従たる見出し語の一覧をガイダンスとしてユーザに提示する提示手段を備える
    ことを特徴とする請求項1記載の携帯電話機。
  3. 前記サーバ装置を介した通信機能とは、プッシュ・トゥ・トーク機能であり、
    第2の電話帳は、プッシュ・トゥ・トーク機能用の電話帳であり、
    当該電話帳は、プッシュ・トゥ・トーク機能における通信相手の情報を、主たる見出し語に対応ずけて示している
    ことを特徴とする請求項1記載の携帯電話機。
  4. 前記携帯電話機は、プッシュ・トゥ・トーク機能を実現するシステムにおける子機である
    ことを特徴とする請求項3記載の携帯電話機。
  5. 従たる見出し語は、通信相手の情報の属性を含み
    通信相手の情報が自宅の電話番号、
    職場の電話番号、携帯電話機の電話番号、ファックスの番号、電子メールのアドレス、URLの何れであるかを示す
    ことを特徴とする請求項1〜3の何れかに記載の携帯電話機。
JP2004168984A 2004-06-07 2004-06-07 携帯電話機 Active JP4496015B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004168984A JP4496015B2 (ja) 2004-06-07 2004-06-07 携帯電話機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004168984A JP4496015B2 (ja) 2004-06-07 2004-06-07 携帯電話機

Publications (2)

Publication Number Publication Date
JP2005348364A JP2005348364A (ja) 2005-12-15
JP4496015B2 true JP4496015B2 (ja) 2010-07-07

Family

ID=35500275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004168984A Active JP4496015B2 (ja) 2004-06-07 2004-06-07 携帯電話機

Country Status (1)

Country Link
JP (1) JP4496015B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04213933A (ja) * 1990-12-11 1992-08-05 Sony Corp デジタルコードレス電話装置
JP2001339502A (ja) * 2000-03-20 2001-12-07 Denso Corp 電話機における音声作動応答方法、音声作動応答システム、電話機およびコンピュータ・プログラム
JP2004500774A (ja) * 2000-03-03 2004-01-08 クゥアルコム・インコーポレイテッド 既存の通信システムにおけるグループ通信サービスに参加するための方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04213933A (ja) * 1990-12-11 1992-08-05 Sony Corp デジタルコードレス電話装置
JP2004500774A (ja) * 2000-03-03 2004-01-08 クゥアルコム・インコーポレイテッド 既存の通信システムにおけるグループ通信サービスに参加するための方法及び装置
JP2001339502A (ja) * 2000-03-20 2001-12-07 Denso Corp 電話機における音声作動応答方法、音声作動応答システム、電話機およびコンピュータ・プログラム

Also Published As

Publication number Publication date
JP2005348364A (ja) 2005-12-15

Similar Documents

Publication Publication Date Title
JP4932167B2 (ja) 携帯電話
JP4226055B2 (ja) 通信端末装置及びプログラム
US8346296B2 (en) Portable telephone
US7363222B2 (en) Method for searching data in at least two databases
KR100301219B1 (ko) 음성 인식/합성을 이용한 통신망에서의 음성 포탈 서비스시스템 및 그 서비스 방법
JP5120259B2 (ja) 通信装置、通信方法、並びに、情報記録媒体
CN1937650B (zh) 通信终端和拨号注册方法
US20060182242A1 (en) Method and device for obtaining data related to the presence and/or availability of a user
US8069189B2 (en) Portable terminal
JP4496015B2 (ja) 携帯電話機
JP2000353044A (ja) Urlアドレス検索用サーバ、これを用いた通信システムおよびurlアドレス特定方法
JP4764299B2 (ja) 携帯電話機特定方法、サーバ装置およびコンピュータプログラム
KR20050082459A (ko) 사용자 단말기내의 저장 정보 검색 방법 및 그 방법을이용하는 사용자 단말기
JP2001268206A (ja) 携帯無線電話装置
JP2000049961A (ja) 電話通信装置
JP2011035811A (ja) ストレージシステム、アクセス管理装置、データ転送方法およびプログラム
KR100663479B1 (ko) 이동통신단말기에서의 전화번호 저장 방법
JP2010279046A (ja) 携帯電話
JPH11331426A (ja) 電話番号取り込み機能付き通信装置
JP5454840B2 (ja) 通信端末
JP2005107565A (ja) 辞書自動切換機能付き携帯端末、携帯端末での辞書自動切換方法、および辞書選択プログラム。
WO2002071730A1 (fr) Telephone radio portatif
JP4246649B2 (ja) 携帯電話機
KR20030031232A (ko) 휴대 단말기의 전화번호 검색방법
JP2007318633A (ja) ネットワークシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070521

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080801

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100316

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 4