JP7340835B2 - プログラム、情報処理方法、及び情報処理装置 - Google Patents
プログラム、情報処理方法、及び情報処理装置 Download PDFInfo
- Publication number
- JP7340835B2 JP7340835B2 JP2019033090A JP2019033090A JP7340835B2 JP 7340835 B2 JP7340835 B2 JP 7340835B2 JP 2019033090 A JP2019033090 A JP 2019033090A JP 2019033090 A JP2019033090 A JP 2019033090A JP 7340835 B2 JP7340835 B2 JP 7340835B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- processing device
- audio data
- call
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
図1は、本開示のシステム概要を説明するための図である。図1に示す例では、ユーザUA(孫)が、ユーザUB(祖母)との通話を開始したいことを想定する。ユーザUAは、携帯端末などの情報処理装置20Aを利用し、ユーザUBは、携帯端末などの情報処理装置20Bを利用する。また、サーバ10は、IP(Internet Protocol)電話の呼制御を行う情報処理装置である。なお、図1に示す概要は、IP電話の例を用いるが、WebRTC(Web Real-time Communication)技術などを用いるP2P通信により通話が実現される例も含んでもよい。
まず、ユーザUAは、情報処理装置20Aに向かって、「おーい、おばあちゃん!」と呼びかける。このとき、情報処理装置20Aでは、所定のアプリケーションが実行されており、このアプリケーションの下で、マイク機能はオンにされている。情報処理装置20Aは、マイクから「おーい、おばあちゃん!」の音声データを入力し、この音声データに対して音声認識処理を実行する。
サーバ10は、リクエストに含まれる呼出先情報から、ユーザUBが利用する情報処理装置20Bを特定し、特定された情報処理装置20Bに、セッションを開始するためのリクエストと、音声データとを送信する。
「おーい、おばあちゃん!」という音声が情報処理装置20Bから出力されると、ユーザUBは、通常の会話をするように、例えば、「どうしたの?」と回答する。情報処理装置20Bは、「どうしたの?」という音声データを音声認識し、認識結果がリクエストに対応するレスポンスであるか否かを判定する。このとき、認識結果が、予め設定された音声データを示す場合、情報処理装置20Bは、入力された音声データはレスポンスであると判定し、セッションを開始するためのリクエストに対するレスポンスと、入力された音声データとをサーバ10に送信する。レスポンスか否かの判定は、音声認識結果が、予め設定された所定のワードに該当するか否かを判定することや、自然言語処理を用いて肯定文(例、「はーい」)であるか否かを判定することなどを含む。
サーバ10は、情報処理装置20Bからレスポンスと音声データとを受信すると、セッションのリクエストを送信した情報処理装置20Aに、レスポンスと音声データとを送信する。この結果、情報処理装置20Aは、受信した音声データをスピーカから出力し、ユーザUAは、「どうしたの?」を聞くことができる。情報処理装置20Aは、セッション確立を確認するメッセージを情報処理装置20Bに送信し、その後、情報処理装置20Bと通話のためのデータの送受信を開始する。通話は、音声通話、ビデオ通話のいずれでもよい。
次に、上述したシステムを実現するためのシステム構成例について説明する。図2は、第1実施形態に係る情報処理システム1の概略構成の一例を示す図である。図2に示すように、サーバ10と、各ユーザが利用するユーザ端末20A、20B、20C、20D、・・・とが、ネットワークNを介して相互に通信可能に接続されることにより、情報処理システム1が構成される。以降、ユーザ端末を個別に区別する必要がない場合は、符号20を用いる。また、サーバ10について、ネットワークNに接続される数は複数あってもよい。
次に、シームレス通話機能を実行する情報処理システム1に係る各装置のハードウェア構成について説明する。図3は、第1実施形態に係るサーバ10のハードウェア構成の一例を示す図である。図3に示すように、サーバ10は、制御部102と、通信インタフェース104と、記憶部106と、を有し、各部はバスライン112を介して接続される。
次に、図5を用いて、第1実施形態に係る情報処理システム1の各装置の機能について説明する。図5に示す例では、ユーザ端末20Aは、発呼側であり、リクエストメッセージを送信する側のUAC(User Agent Client)である。ユーザ端末20Bは、着呼側であり、レスポンスメッセージを送信する側のUAS(User Agent Server)である。なお、各ユーザ端末20は、発呼側にも着呼側にもなりうるため、UACの機能と、UASの機能との両方の機能を有する。
INVITE:セッション開始要求
ACK:セッション確立の確認
BYE:セッション終了
REGISTER:情報の登録
…
(B)レスポンス
1XX:リクエストを受信して、その処理を実行中
2XX:リクエストの成功
3XX:リクエストを完了させるために、他リソースへの再実行を指示
…
入力部302Aは、マイク220により集音された第1音声データを入力する。例えば、図1に示す例では、入力部302Aは、第1ユーザの呼びかけ音声である「おーい、おばあちゃん」の音声データを入力する。入力された音声データは、バッファに記憶され、所定時間経過後に削除される。
受信部312Aは、サーバ10から、「200 OK」を示すレスポンスを受信する。このとき、受信部312Aは、呼出先で入力され、呼びかけの第1音声データに対する応答の第2音声データも受信する。第2音声データは、図1に示す例では、「どうしたの」である。
サーバ10は、受信部402、呼制御部404、及び送信部406を有する。サーバ10における各部の機能は、図3に示す制御部102が制御プログラム108を実行することにより実現される。
ユーザ端末20Bは、入力部302B、認識部304B、送信部306B、発呼処理部308B、通話処理部320B、受信部312B、判定部316Bを含む着呼処理部314B、及び出力部318Bを有する。ユーザ端末20Bにおける各部の機能は、図4に示す制御部202がアプリプログラム210を実行することにより実現される。また、ユーザ端末20Bの機能は、ユーザ端末20Aが有する機能と同様である。以下では、着呼処理機能を主に説明する。
次に、情報処理システム1の各動作について説明する。図8は、第1実施形態に係る動作処理の一例を示すシーケンス図である。
図11は、本開示の第2実施形態に係るシステム2の概要を説明する図である。図2に示されるシステム2は、画像を管理するためのシステムに第1実施形態で説明したシステムを適用したシステムであり、管理装置10Aと、サーバ10Bと、ユーザ端末20と、画像出力装置30とを含む。また、画像出力装置30は、表示装置40と接続され、表示装置40は、遠隔制御装置50によって制御される。 サーバ10Bは、第1実施形態で説明したサーバ10である。
Claims (11)
- 情報処理装置に、
第1音声データを入力し、
入力された第1音声データを音声認識し、
前記第1音声データの認識結果に関連付けられる呼出先を特定し、
前記呼出先の他の情報処理装置を示す呼出先情報と、呼出元の前記情報処理装置を示す呼出元情報と、前記第1音声データを識別する識別情報とを含むリクエストであって、セッションの開始を要求するリクエストを呼制御サーバに送信し、
前記第1音声データを、前記呼制御サーバ又は前記他の情報処理装置に送信する、処理を実行させるプログラム。 - 前記情報処理装置に、
前記他の情報処理装置から送信された前記リクエストに対するレスポンスを、前記呼制御サーバを介して受信し、
前記他の情報処理装置から送信され、前記レスポンスの判定に用いられた第2音声データを、直接的に、又は前記呼制御サーバを介して受信し、
前記第2音声データを出力する、処理をさらに実行させる請求項1に記載のプログラム。 - 前記情報処理装置に、
前記第2音声データの出力後、前記他の情報処理装置との間で前記セッションにおけるデータの送受信を行う、処理をさらに実行させる請求項2に記載のプログラム。 - 前記情報処理装置に、
第3音声データを入力し、
前記第3音声データを音声認識し、
前記第3音声データの認識結果が、予め設定された終了条件を満たす場合、前記セッションを終了する、処理をさらに実行させる請求項3に記載のプログラム。 - 前記セッションを終了することは、
前記第3音声データの認識結果が前記終了条件を満たしてから、所定時間内に音声データの出力又は入力がない場合に、前記セッションを終了することを含む、請求項4に記載のプログラム。 - 情報処理装置が、
第1音声データを入力し、
入力された第1音声データを音声認識し、
前記第1音声データの認識結果に関連付けられる呼出先を特定し、
前記呼出先の他の情報処理装置を示す呼出先情報と、呼出元の前記情報処理装置を示す呼出元情報と、前記第1音声データを識別する識別情報とを含むリクエストであって、セッションの開始を要求するリクエストを送信し、
前記第1音声データを、呼制御サーバ又は前記他の情報処理装置に送信する、情報処理方法。 - 第1音声データを入力する入力部と、
入力された第1音声データを音声認識する認識部と、
前記第1音声データの認識結果に関連付けられる呼出先を特定する特定部と、
前記呼出先の他の情報処理装置を示す呼出先情報と、呼出元の前記情報処理装置を示す呼出元情報と、前記第1音声データを識別する識別情報とを含むリクエストであって、セッションの開始を要求するリクエストを送信し、かつ、前記第1音声データを、呼制御サーバ又は前記他の情報処理装置に送信する送信部と、
を備える情報処理装置。 - 情報処理装置に、
呼出先の前記情報処理装置を示す呼出先情報と、呼出元の他の情報処理装置を示す呼出元情報とを含むリクエストであって、セッションの開始を要求するリクエストを呼制御サーバから受信し、
第1音声データを前記呼制御サーバ又は前記他の情報処理装置から受信し、
前記第1音声データを出力し、
第2音声データを入力し、
入力された第2音声データを音声認識し、
前記第2音声データの認識結果が、前記リクエストに対するレスポンスを示す場合、前記レスポンスを前記呼制御サーバに送信し、
前記第2音声データを前記呼制御サーバ又は前記他の情報処理装置に送信する、処理を実行させるプログラム。 - 前記第1音声データを出力することは、
前記第2音声データが入力されるまで、又は、所定時間が経過するまで、前記第1音声データを繰り返し出力することを含む、請求項8に記載のプログラム。 - 情報処理装置が、
呼出先の前記情報処理装置を示す呼出先情報と、呼出元の他の情報処理装置を示す呼出元情報とを含むリクエストであって、セッションの開始を要求するリクエストを呼制御サーバから受信し、
第1音声データを前記呼制御サーバ又は前記他の情報処理装置から受信し、
前記第1音声データを出力し、
第2音声データを入力し、
入力された第2音声データを音声認識し、
前記第2音声データの認識結果が、前記リクエストに対するレスポンスを示す場合、前記レスポンスを前記呼制御サーバに送信し、
前記第2音声データを前記呼制御サーバ又は前記他の情報処理装置に送信する、情報処理方法。 - 呼出先の情報処理装置を示す呼出先情報と、呼出元の他の情報処理装置を示す呼出元情報とを含むリクエストであって、セッションの開始を要求するリクエストを呼制御サーバから受信し、かつ、第1音声データを前記呼制御サーバ又は前記他の情報処理装置から受信する受信部と、
前記第1音声データを出力する出力部と、
第2音声データを入力する入力部と、
入力された第2音声データを音声認識する認識部と、
前記第2音声データの認識結果が、前記リクエストに対するレスポンスを示す場合、前記レスポンスを前記呼制御サーバに送信し、かつ、前記第2音声データを前記呼制御サーバ又は前記他の情報処理装置に送信する送信部と、
を備える情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019033090A JP7340835B2 (ja) | 2019-02-26 | 2019-02-26 | プログラム、情報処理方法、及び情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019033090A JP7340835B2 (ja) | 2019-02-26 | 2019-02-26 | プログラム、情報処理方法、及び情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020141162A JP2020141162A (ja) | 2020-09-03 |
JP7340835B2 true JP7340835B2 (ja) | 2023-09-08 |
Family
ID=72280605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019033090A Active JP7340835B2 (ja) | 2019-02-26 | 2019-02-26 | プログラム、情報処理方法、及び情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7340835B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002218014A (ja) | 2001-01-22 | 2002-08-02 | J-Phone Tokai Co Ltd | 着信音指定機能付き情報端末 |
US20100173675A1 (en) | 2009-01-05 | 2010-07-08 | Ure Michael J | "Talk-to-talk" telephony, especially mobile telephony |
JP2010183205A (ja) | 2009-02-03 | 2010-08-19 | Panasonic Electric Works Co Ltd | 通話システム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05110635A (ja) * | 1991-10-21 | 1993-04-30 | Ricoh Co Ltd | 電話装置 |
-
2019
- 2019-02-26 JP JP2019033090A patent/JP7340835B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002218014A (ja) | 2001-01-22 | 2002-08-02 | J-Phone Tokai Co Ltd | 着信音指定機能付き情報端末 |
US20100173675A1 (en) | 2009-01-05 | 2010-07-08 | Ure Michael J | "Talk-to-talk" telephony, especially mobile telephony |
JP2010183205A (ja) | 2009-02-03 | 2010-08-19 | Panasonic Electric Works Co Ltd | 通話システム |
Also Published As
Publication number | Publication date |
---|---|
JP2020141162A (ja) | 2020-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2499359C2 (ru) | Управляемое клиентом динамическое перенаправление вызова | |
US8281369B2 (en) | Method and apparatus for creating secure write-enabled web pages that are associated with active telephone calls | |
US8315377B2 (en) | Method and device for dispatching an alert message in a network | |
EP1839175A2 (en) | Agnostic peripheral control for media communication appliances | |
TW201703494A (zh) | 具有觀看郵件的呼叫接聽 | |
JP2006352319A (ja) | 通信システムおよび通信方法 | |
JP2010081279A (ja) | 受信装置、送受信システム、及び受信方法 | |
JP7340835B2 (ja) | プログラム、情報処理方法、及び情報処理装置 | |
JP4371874B2 (ja) | 通話保留音出力方法及びsipサーバ | |
JP4723676B2 (ja) | セッション状態の通知に係る通信方法、サーバ、およびプログラム | |
CN101594623B (zh) | 一种互联网协议语音呼叫的监听方法及设备 | |
JP4191183B2 (ja) | Ip電話システム、パケット変換装置およびパケット変換方法 | |
JP2006270558A (ja) | 発信中にコンテンツを再生するip電話装置の発信方法及びプログラム | |
JP6396685B2 (ja) | 呼制御装置、受信機及びそれらの制御方法 | |
WO2017000781A1 (zh) | 一种视频通信方法及装置 | |
JP4458297B2 (ja) | サービス提供システム、情報処理装置、ip電話装置及びサービス提供方法 | |
JP5678473B2 (ja) | 情報処理端末 | |
JP2017005466A (ja) | 呼制御処理システム、ゲートウェイ装置、呼制御処理方法およびプログラム | |
JP5555120B2 (ja) | コンテンツ提供方法、コンテンツ取得方法、コンテンツ提供システム及び端末装置 | |
JP2008270899A (ja) | 通信制御装置、通信傍受装置、通信傍受システム、通信制御方法、及び通信傍受方法 | |
JP6226799B2 (ja) | Ip−pbxシステムおよびその音源データ提供方法 | |
JP2011114453A (ja) | 録音情報伝達システム、録音情報伝達方法及び録音情報管理装置 | |
JP2011083039A (ja) | 通信システム及びサーバ装置 | |
JP2007129457A (ja) | Ip通信システムおよびip電話端末装置 | |
JP2005269226A (ja) | 音声通話システム、その端末及び音声通話システムの通話方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230327 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7340835 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |