JP6485214B2 - Electronic library system - Google Patents
Electronic library system Download PDFInfo
- Publication number
- JP6485214B2 JP6485214B2 JP2015105186A JP2015105186A JP6485214B2 JP 6485214 B2 JP6485214 B2 JP 6485214B2 JP 2015105186 A JP2015105186 A JP 2015105186A JP 2015105186 A JP2015105186 A JP 2015105186A JP 6485214 B2 JP6485214 B2 JP 6485214B2
- Authority
- JP
- Japan
- Prior art keywords
- electronic library
- procedure
- voice
- electronic
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 279
- 239000000463 material Substances 0.000 claims description 159
- 238000000605 extraction Methods 0.000 claims description 66
- 230000015572 biosynthetic process Effects 0.000 claims description 29
- 238000003786 synthesis reaction Methods 0.000 claims description 29
- 238000010187 selection method Methods 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 13
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000001771 impaired effect Effects 0.000 description 25
- 230000008569 process Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 12
- 239000012776 electronic material Substances 0.000 description 11
- 230000007704 transition Effects 0.000 description 9
- 230000008707 rearrangement Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は,インターネットを利用して電子資料を貸し出す電子図書館を音声操作できるようにした発明である。 The present invention is an invention in which an electronic library that lends electronic materials can be operated by voice using the Internet.
目の不自由な方(以下,「視覚障害者」と記す。)にとって,読書から得られる楽しみは健常者よりも大きいため,視覚障害者用の図書館として,視覚障害者用の図書(点字図書と録音図書)を視覚障害者に貸し出す点字図書館が既に設立されている。しかし,点字図書館が蔵書する視覚障害者用の図書はボランティアの協力を得て製作されるため,視覚障害者用の図書の蔵書数は通常の図書館よりも遥かに少なく,また,点字図書館は,視覚障害者用の図書を郵送で視覚障害者に貸し出すため,リアルタイムで視覚障害者用の図書を借りることができない問題もある。 For those who are blind (hereinafter referred to as “visually impaired”), the enjoyment gained from reading is greater than that of healthy people, so as a library for the visually impaired, books for the visually impaired (Braille books) Braille libraries have already been established to lend out books to the visually impaired. However, because the books for the visually impaired, which are collected by the Braille Library, are produced with the cooperation of volunteers, the number of books for the visually impaired is much smaller than the regular library. There is also a problem that books for the visually impaired cannot be borrowed in real time because books for the visually impaired are lent to the visually impaired by mail.
一方で,健常者用の図書館については,利用者の利便性を高めるために,インターネットを利用して電子資料を貸し出す電子図書館の普及が進んでいる。インターネットを用いた電子図書館に係る発明は既に開示され,例えば,特許文献1では,ユーザがインターネットを介して電子図書館にアクセスし,電子資料の検索、電子資料の貸出及び電子資料の返却などの手続をすることができるシステムが開示されている。
On the other hand, with regard to libraries for healthy people, electronic libraries that lend electronic materials using the Internet are increasing in order to improve convenience for users. Inventions related to electronic libraries using the Internet have already been disclosed. For example, in
視覚障害者が電子図書館を利用できれば,視覚障害者は,図書館の建屋に出向かなくとも電子資料を借りることができるし,また,視覚障害者が借りることのできる電子資料の数も増えるが,電子資料を貸し出す電子図書館は,視覚障害者が独力で利用し易いように構成されていない。 If visually impaired people can use electronic libraries, visually impaired people can borrow electronic materials without going to the library building, and the number of electronic materials that visually impaired people can borrow increases. Electronic libraries that lend electronic materials are not designed to be easily accessible by the visually impaired.
視覚障害者が独力で電子図書館を利用し易くするためには,画面を見ずに電子図書館を利用できればよく,音声を利用して電子図書館を操作できれば,視覚障害者が独力で利用し易くなると考えられる。 In order to make it easy for visually impaired people to use the electronic library by themselves, it is only necessary to be able to use the electronic library without looking at the screen, and if the electronic library can be operated using voice, it will be easier for visually impaired people to use the library independently. Conceivable.
音声を利用した図書システムに係る発明としては,特許文献2において,音声を利用することで,視覚障害者の利便性を高めた情報アクセスシステムが開示されている。特許文献2には,ユーザの音声を音声認識すること,音声認識結果に基づいて電子資料(刊行物)を検索することで,電子資料のテキストの音声合成を生成することなどが記載されているが,特許文献2に係る発明では,音声を利用して電子図書館を操作できることには着眼されていない。
As an invention relating to a book system using voice,
電子図書館は,複数のWebページを有し,Webページを任意に切り替えられるように構成されているが,画面を見ることができない視覚障害者にとって,音声により電子図書館のWebページを任意に切り替えることができたとしても,電子図書館のWebページを任意に切り替えて電子図書館を利用することは困難である。 The electronic library has a plurality of Web pages and can be switched arbitrarily. However, for visually impaired people who cannot see the screen, the Web page of the electronic library can be switched arbitrarily by voice. Even if it is possible, it is difficult to use the electronic library by arbitrarily switching the Web page of the electronic library.
そこで,本発明は,視覚障害者が音声により電子図書館を容易に利用できる電子図書館システムを提供することを課題とする。 Therefore, an object of the present invention is to provide an electronic library system in which a visually impaired person can easily use an electronic library by voice.
上述した課題を解決する第1の発明は,ネットワークを介して利用できる様々な電子図書館サービスを提供し,電子図書館サービスの呼び出し要求を受けると,呼び出し要求を受けた前記電子図書館サービスを実行し,前記電子図書館サービスの呼び出し要求をした装置に対して,前記電子図書館サービスの実行結果を送信する電子図書館サイトと,前記電子図書館サイトが提供している前記電子図書館サービスを利用するアプリケーションプログラムを実装した携帯端末と,前記携帯端末から音声の特徴量を受信すると,音声の特徴量を用いて音声認識を行い,音声認識により得られたテキスト形式の音声認識結果を前記携帯端末へ送信する音声認識サーバと,前記携帯端末からテキストを受信すると,このテキストの合成音声を生成して前記携帯端末へ送信する音声合成サーバとから少なくとも構成された電子図書館システムである。
視覚障害者であっても,音声により電子図書館を容易に利用できるように,前記アプリケーションプログラムが起動することで,前記携帯端末は,ユーザがマイクに入力した音声の特徴量を抽出して,音声の特徴量を前記音声認識サーバに送信し,ユーザがマイクに入力した音声に対応する音声認識結果を前記音声認識サーバから取得する特徴量抽出部と,前記電子図書館サイトの操作に係る手続きとその実行順序を記述した電子図書館操作フローが登録され,前記電子図書館操作フローに記述されている前記手続きを実行する際,音声入力を開始する動作を検知すると,前記特徴量抽出部を作動させて,ユーザがマイクに入力した音声の音声認識結果を前記特徴量抽出部から取得した後,前記特徴量抽出部から取得した音声認識結果を利用して,この時点の前記手続きに対応する前記前記電子図書館サービスを呼び出し,呼び出した前記前記電子図書館サービスの実行結果を前記電子図書館サイトから受信すると,前記音声合成サーバを利用して,前記電子図書館サイトから受信した実行結果に対応する合成音声を生成して音声出力する手続き実行部を備える。
The first invention that solves the above-mentioned problems provides various electronic library services that can be used via a network. When a call request for the electronic library service is received, the electronic library service that receives the call request is executed, An electronic library site that transmits the execution result of the electronic library service and an application program that uses the electronic library service provided by the electronic library site are installed on the device that has requested the electronic library service to be called. A voice recognition server that performs voice recognition using a voice feature amount and transmits a voice recognition result in a text format obtained by voice recognition to the portable terminal when a voice feature amount is received from the portable terminal and the portable terminal When text is received from the mobile terminal, a synthesized speech of the text is generated. Serial at least configured digital library system from a voice synthesizing server for transmitting to the portable terminal.
Even if it is a visually impaired person, when the application program is started so that the electronic library can be easily used by voice, the portable terminal extracts the feature amount of the voice input by the user to the microphone, and A feature amount extraction unit that transmits a feature recognition amount corresponding to a speech input by a user to a microphone from the speech recognition server, a procedure related to operation of the electronic library site, and When an electronic library operation flow describing the execution order is registered and when the procedure described in the electronic library operation flow is executed, when the operation of starting speech input is detected, the feature amount extraction unit is operated, After the speech recognition result of the voice input by the user to the microphone is acquired from the feature amount extraction unit, the speech recognition result acquired from the feature amount extraction unit is used. Then, when the electronic library service corresponding to the procedure at this time is called and the execution result of the called electronic library service is received from the electronic library site, the electronic library site is utilized using the speech synthesis server. A procedure execution unit for generating a synthesized speech corresponding to the execution result received from and outputting the synthesized speech.
上述した課題を解決する第2の発明は,第1の発明に記載した電子図書館システムにおいて,前記手続き実行部は,音声入力を開始する動作を検知すると,この時点の前記手続きに係る音声ガイダンスを音声出力してから,前記特徴量抽出部を作動させることを特徴とする。前記手続き実行部が,音声入力を開始する動作を検知すると,この時点の前記手続きに係る音声ガイダンスを音声出力するように構成することで,ユーザは,前記手続き実行部が実行しているこの時点の前記手続きを音声ガイダンスにより把握できる。 According to a second invention for solving the above-described problem, in the electronic library system according to the first invention, when the procedure execution unit detects an operation of starting voice input, the voice guidance related to the procedure at this time is displayed. The feature extraction unit is activated after outputting the voice. When the procedure execution unit detects an operation to start voice input, the voice guidance related to the procedure at this time is configured to be output by voice so that the user can Can be grasped by voice guidance.
上述した課題を解決する第3の発明は,第1の発明または第2の発明に記載した電子図書館システムにおいて,前記携帯端末はモーションセンサを備え,前記手続き実行部は,前記携帯端末が振られたことを,音声入力を開始する動作として検知することを特徴とする。音声入力を開始する動作は,音声入力を開始するためのボタンオブジェクトを選択する動作とすることもできるが,ユーザが視覚障害者であることを想定すると,前記携帯端末が振られたことを,音声入力を開始する動作として検知するようにすることが好適である。 According to a third invention for solving the above-described problem, in the electronic library system according to the first invention or the second invention, the mobile terminal includes a motion sensor, and the procedure execution unit is configured to shake the mobile terminal. Is detected as an operation of starting voice input. The action of starting voice input can be an action of selecting a button object for starting voice input, but assuming that the user is a visually impaired person, It is preferable to detect as an operation of starting voice input.
上述した課題を解決する第4の発明は,第1の発明から第3の発明のいずれか一つに記載した電子図書館システムにおいて,資料を検索する前記電子図書館サービスを呼び出し,前記特徴量抽出部から取得した音声認識結果に適合する資料を検索する資料検索手続き,前記資料検索手続きの検索結果に含まれるテキストの合成音声を音声出力した後,資料を選択する前記電子図書館サービスを呼び出し,前記特徴量抽出部から取得した音声認識結果に対応する資料を選択する資料選択手続き,前記電子図書館サイトにログインする前記電子図書館サービスを呼び出し,前記特徴量抽出部から取得した音声認識結果を利用して,前記電子図書館サイトにログインするログイン手続き,資料を貸出しする前記電子図書館サービスを呼び出し,前記資料選択手続きにて選択した資料を前記電子図書館サイトから借りる貸出手続き,資料のコンテンツを提供する前記電子図書館サービスを呼び出し,前記貸出手続きにて前記電子図書館サイトから借りた資料のコンテンツに含まれるテキストを合成音声により再生する再生手続きを順に実行することを,前記電子図書館サイトから資料を借りて読む操作に係る前記手続きとその実行順序として前記電子図書館操作フローに記述したことを特徴とする。第4の発明によれば,前記電子図書館サイトから資料を借りて読む一連の操作を音声により実施できる。 According to a fourth invention for solving the above-mentioned problem, in the electronic library system according to any one of the first to third inventions, the electronic library service for retrieving materials is called up, and the feature quantity extracting unit A document search procedure for searching for a document that matches the speech recognition result obtained from the above, a synthesized speech of text included in the search result of the document search procedure is output as voice, and the electronic library service for selecting the document is called, A material selection procedure for selecting a material corresponding to the speech recognition result acquired from the amount extraction unit, the electronic library service for logging in to the electronic library site is called, and the speech recognition result acquired from the feature amount extraction unit is used. Login procedure for logging in to the electronic library site, calling the electronic library service for renting materials, Lending procedures for borrowing materials selected in the fee selection procedure from the electronic library site, calling the electronic library service providing the content of the materials, and text included in the contents of the materials borrowed from the electronic library site in the lending procedure Is described in the electronic library operation flow as the procedure relating to the operation of borrowing and reading materials from the electronic library site and the execution order thereof. According to the fourth invention, a series of operations for borrowing and reading materials from the electronic library site can be performed by voice.
上述した課題を解決する第5の発明は,第4の発明に記載した電子図書館システムであって,前記資料選択手続きにおいて,ユーザが借りている資料が検索されると,資料を返却する前記電子図書館サービスを呼び出し,前記特徴量抽出部から取得した音声認識結果によって指定された資料を前記電子図書館サイトへ返却する返却手続きを実行することを,資料の返却操作に係る前記手続きとその実行順序として前記電子図書館操作フローに記述したことを特徴とする。第5の発明によれば,前記電子図書館サイトから借りた資料を返却する操作を音声により実施できる。 A fifth invention that solves the above-described problem is the electronic library system according to the fourth invention, wherein the electronic document system returns a material when a material borrowed by a user is searched in the material selection procedure. Calling the library service and executing the return procedure for returning the material specified by the voice recognition result acquired from the feature amount extraction unit to the electronic library site is performed as the procedure related to the material return operation and the execution order thereof. It is described in the electronic library operation flow. According to the fifth aspect, the operation of returning the materials borrowed from the electronic library site can be performed by voice.
上述した課題を解決する第6の発明は,第4の発明または第5の発明に記載した電子図書館システムであって,前記資料選択手続きにて選択した資料が貸出不可の場合,資料を予約する前記電子図書館サービスを呼び出し,前記資料選択手続きにて選択した資料を前記電子図書館サイトに予約する予約手続きを実行することを,資料の予約操作に係る前記手続きとその実行順序として前記電子図書館操作フローに記述したことを特徴とする。第6の発明によれば,前記電子図書館サイトに資料を予約する操作を音声により実施できる。 A sixth invention for solving the above-described problem is the electronic library system described in the fourth invention or the fifth invention, and reserves a material when the material selected in the material selection procedure cannot be lent. Calling the electronic library service and executing the reservation procedure for reserving the material selected in the material selection procedure in the electronic library site is the electronic library operation flow as the procedure relating to the material reservation operation and its execution order. It is characterized by having described it. According to the sixth invention, the operation of reserving materials at the electronic library site can be performed by voice.
上述した課題を解決する第7の発明は,第4の発明から第6の発明のいずれか一つに記載した電子図書館システムにおいて,前記アプリケーションプログラムが起動することによって前記携帯端末は,ユーザがマイクに入力した音声の声紋を認証する声紋認証部を備え,前記手続き実行部は,前記ログイン手続きにおいて,ユーザがマイクに入力した音声の声紋認証に前記声紋認証部が成功したときのみ,前記電子図書館サイトにログインする前記電子図書館サービスを呼び出すことを特徴とする。ユーザがマイクに入力した音声の声紋を認証することで,前記電子図書館サイトへのログインに係るセキュリティを高めることができる。 According to a seventh invention for solving the above-described problem, in the electronic library system according to any one of the fourth to sixth inventions, when the application program is activated, the portable terminal is connected to a microphone by a user. A voice print authentication unit for authenticating a voice print of a voice input to the electronic library, and the procedure executing unit is configured to perform the electronic library only when the voice print authentication unit succeeds in the voice print authentication of a voice input by a user to a microphone in the login procedure. Calling the electronic library service to log in to the site. By authenticating the voice print of the voice input to the microphone by the user, security related to login to the electronic library site can be enhanced.
上述した本発明に係る電子図書館システムによれば,電子図書館操作フローに従い,音声を利用する手続きが自動的に実行されるため,視覚障害者であっても,音声により電子図書館を容易に利用できるようになる。 According to the electronic library system according to the present invention described above, the procedure using voice is automatically executed according to the operation flow of the electronic library, so that even the visually impaired can easily use the electronic library by voice. It becomes like this.
ここから,本発明の好適な実施形態を記載する。なお,以下の記載は本発明の技術的範囲を束縛するものでなく,理解を助けるために記述するものである。 From here, preferred embodiments of the present invention will be described. The following description is not intended to limit the technical scope of the present invention, but is provided to aid understanding.
ここから,本実施形態に係る電子図書館システム1について説明する。図1は,本実施形態に係る電子図書館システム1の構成を説明する図である。本実施形態に係る電子図書館システム1は,視覚障害者が独力で電子図書館を利用できるように発案されたシステムで,図1に図示したように,携帯端末2,電子図書館サイト3,音声認識サーバ4,音声合成サーバ5を含み,それぞれはネットワーク1aを介してデータ通信できる。
From here, the
電子図書館システム1を構成する電子図書館サイト3は,電子図書館サイト3で蓄積しているさまざまな電子資料(以下,単に「資料」と記す。)の検索,資料の貸出,資料の予約,資料の返却など電子図書館業務に係る様々な手続きを,携帯端末2で動作するアプリケーションプログラムが利用できるようにするため電子図書館サービスを提供し,本実施形態では,電子図書館サービスを呼び出すためのAPI(Application Programming Interface)を外部に公開している。電子図書館サイト3は,HTTP(HyperText Transfer Protocol)を利用して携帯端末2とデータ通信し,携帯端末2から呼び出されたAPIに対応する電子図書館サービスに係る処理を実行し,その実行結果を携帯端末2へ返信する処理を行う。なお,電子図書館サイト3はクラウド型のシステムで構成することが好適である。
The electronic library site 3 constituting the
電子図書館システム1を構成する音声認識サーバ4は,携帯端末2から受信した音声の特徴量を音声認識し,テキスト形式の音声認識結果を携帯端末2へ送信するサーバである。音声認識の手法は様々あるが,本実施形態に係る音声認識サーバ4は,認識単位の単語毎に音声の特徴量を保持し,携帯端末2から受信した音声の特徴量に対応する単語を特定して順に並べることでテキスト形式の音声認識結果を生成する。
The speech recognition server 4 that constitutes the
電子図書館システム1を構成する音声合成サーバ5は,携帯端末2から受信したテキストを解析し,テキストに含まれる文字に対応する音声を合成することで,所定形式(例えば,MP3形式)の合成音声を生成して携帯端末2へ送信するサーバである。音声合成の手法は様々あるが,対象となるテキストを形態素解析してテキストを発音記号列に変換し,発音記号列から音声合成に必要なパラメータを生成して,このパラメータを用いて音声波形を合成することで合成音声を生成する手法が既に知られている。
The speech synthesis server 5 constituting the
電子図書館システム1を構成する携帯端末2は,ユーザ(ここでは,視覚障害者になる)が電子図書館サイト3を利用する際に用いる端末で,具体的には,スマートフォンやタブレットである。
A
図2は,本実施形態に係る携帯端末2のブロック図である。図2に図示したように,携帯端末2は,マイク24,モーションセンサ25,タッチパネル26およびスピーカ27を備える。携帯端末2が備えるマイク24は,音を電気信号に変換する機器である。携帯端末2が備えるモーションセンサ25は,携帯端末2の動きの変化を検出するセンサで,具体的には,3軸ジャイロセンサや3軸加速度センサである。携帯端末2が備えるタッチパネル26は,液晶ディスプレイなどのディスプレイと,ディスプレイに直接触れることで操作を行う装置が組み合わされた電子機器である。携帯端末2が備えるスピーカ27は,音声出力に用いるデバイスで,電気信号を音に変換する機器である。なお,音声出力端子をスピーカ27の代わりに用いてもよい。
FIG. 2 is a block diagram of the
また,携帯端末2は,図2では図示していないプロセッサを動作させるコンピュータプログラムとして,電子図書館サイト3が公開しているAPIを利用して,電子図書館サイト3が提供している電子図書館サービスを呼び出して,音声により電子図書館サイト3を操作できるように構成された電子図書館アプリケーション20がインストールされ,図2に図示しているように,電子図書館アプリケーション20は,手続き実行部21,特徴量抽出部22および声紋認証部23を備える。
In addition, the
電子図書館アプリケーション20が有する特徴量抽出部22は,電子図書館サイト3を利用するユーザの音声を認識するために備えられた機能である。電子図書館アプリケーション20の特徴量抽出部22は,音声認識が指定されて手続き実行部21から呼び出されると,ユーザがマイク24に入力した音声の特徴量(例えば,周波数スペクトルなど)を抽出し,抽出した特徴量を音声認識サーバ4に送信して、ユーザがマイク24に入力した音声を音声認識サーバ4に音声認識させた後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡す処理を実行する。また,電子図書館アプリケーション20の特徴量抽出部22は,音声認識と声紋認証が指定されて手続き実行部21から呼び出されると,上述した内容に加え,ユーザがマイク24に入力した音声を後述する声紋認証部23に引き渡して,声紋認証部23から声紋認証結果を受取り,音声認識サーバ4から受信した音声認識結果と声紋認証部23から受信した声紋認証結果を手続き実行部21に引き渡す処理を実行する。
The feature
電子図書館アプリケーション20が有する声紋認証部23は,電子図書館サイト3を利用するユーザを声紋認識できるように備えられた機能で,特徴量抽出部22から引き渡された音声の声紋と、予め声紋認証部23に登録されている声紋を照合し、声紋認証結果を特徴量抽出部22に引き渡す処理を実行する。
The
電子図書館アプリケーション20が有する手続き実行部21は,音声による電子図書館サイト3の操作を制御するために備えられた機能である。複数のWebページを有する電子図書館サイト3は,Webページを任意に切り替えられるように構成されているが,Webページを見ることができない視覚障害者にとって,Webページを任意に切り替えることは困難である。そこで,本実施形態に係る手続き実行部21は,電子図書館サイト3の操作に係る手続きとその実行順序を記述した電子図書館操作フローに従い,電子図書館操作フローに含まれる手続きを順に実行するように構成され,手続きを実行する際,音声入力を開始する動作を検知すると,特徴量抽出部22を作動させて,ユーザがマイク24に入力した音声の音声認識結果を特徴量抽出部22から取得した後,特徴量抽出部22から取得した音声認識結果を利用して,この時点,すなわち,音声入力を開始する動作を検知した時点の手続きに対応する電子図書館サービスを呼び出し,呼び出した電子図書館サービスの実行結果を電子図書館サイト3から受信すると,音声合成サーバ5を利用して,電子図書館サイト3から受信した実行結果に対応する合成音声を生成し,この合成音声を音声出力する処理を実行する。
The
図3は,本実施形態に係る電子図書館操作フローを説明する図である。図3で図示した電子図書館操作フローには,音声を利用して電子図書館サイト3を操作する手続きとして,資料を検索する電子図書館サービスを呼び出し,特徴量抽出部22から取得した音声認識結果に適合する資料を検索する資料検索手続きT1,資料検索手続きT1の検索結果に含まれるテキストの合成音声を音声出力した後,特徴量抽出部22から取得した音声認識結果に対応する資料を選択する資料選択手続きT2,特徴量抽出部22から取得した音声認識結果をログインキーワードとし,電子図書館サイト3にログインする電子図書館サービスを呼び出し,電子図書館サイト3にログインするログイン手続きT4,資料を貸出す電子図書館サービスを呼び出し,資料選択手続きT2にて選択した資料を電子図書館サイト3から借りる貸出手続きT3,資料のコンテンツを提供する電子図書館サービスを呼び出し,貸出手続きT3にて電子図書館サイト3から借りた資料を再生する再生手続きT5,資料を返却する電子図書館サービスを呼び出し,資料選択手続きT2にて選択した資料を電子図書館サイト3へ返却する返却手続きT6が含まれる。
FIG. 3 is a diagram for explaining an electronic library operation flow according to the present embodiment. In the electronic library operation flow shown in FIG. 3, the electronic library service for retrieving materials is called as a procedure for operating the electronic library site 3 by using voice, and is adapted to the voice recognition result obtained from the feature
図3で図示した電子図書館操作フローによれば,電子図書館アプリケーション20が起動した後に,手続き実行部21が実行する手続きは資料検索手続きT1になり,資料検索手続きT1にて資料を検索すると,手続き実行部21が実行する手続きは資料選択手続きT2に遷移する。資料選択手続きT2にて,資料を選択すると,手続き実行部21が実行する手続きは貸出手続きT3に遷移する。貸出手続きT3において,電子図書館サイト3にログインしているか確認され,電子図書館サイト3にログインしていない場合,手続き実行部21が実行する手続きはログイン手続きT4に遷移する。また,貸出手続きT3において,電子図書館サイト3にログインしている場合,または,ログイン手続きT4において,電子図書館サイト3にログインした後,資料選択手続きT2にて選択した資料を電子図書館サイト3から借りると,手続き実行部21が実行する手続きは再生手続きT5に遷移する。再生手続きT5が終了すると,手続き実行部21が実行する手続きは資料検索手続きT1に戻る。また,資料検索手続きT1において,電子図書館サイト3に返却する資料が検索された場合,手続き実行部21が実行する手続きは返却手続きT6に遷移し,選択された資料を電子図書館サイト3へ返却すると,手続き実行部21が実行する手続きは資料検索手続きT1に戻る。
According to the electronic library operation flow shown in FIG. 3, after the
なお,電子図書館アプリケーション20を起動させる操作は,電子図書館アプリケーション20のアイコンを選択(ダブルタップ)する操作になり,視覚障害者でも電子図書館アプリケーション20を起動できるように,携帯端末2は,音声を使用したアプリケーション起動,また,タッチパネル26に表示されている内容を読み上げるスクリーンリーダに対応していることが望ましい。
Note that the operation of starting the
ここから,図3で図示した電子図書館操作フローに含まれる各手続きにて,電子図書館アプリケーション20の手続き実行部21が実行する処理について詳細に説明する。図4は,資料検索手続きT1において,手続き実行部21が実行する処理を説明する図である。資料検索手続きT1において,電子図書館アプリケーション20の手続き実行部21は,まず,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S1),この時点,すなわち,音声入力を開始する動作を検知した時点に対応する音声ガイダンス(例えば,「キーワードを話してください。」)をスピーカ27から音声出力した後(S2),音声認識を指定して特徴量抽出部22を作動させる(S3)。
From here, the processing executed by the
音声入力を開始する動作は,携帯端末2のタッチパネル26の中央部にボタンオブジェクトを表示し,このボタンオブジェクトを選択(タップ)する動作とすることもできるが,音声入力を開始する動作を,携帯端末2を振る動作とすることが好適である。音声入力を開始する動作を,携帯端末2を振る動作とし,音声入力を開始する動作を検知すると音声ガイダンスを音声出力するように構成することで,ユーザは,携帯端末2を振るだけで,電子図書館アプリケーション20の手続き実行部21が実行している現時点の手続きを把握できる。なお,携帯端末2を振る動作は,携帯端末2のモーションセンサ25を利用して検知できる。
The operation for starting voice input can be an operation in which a button object is displayed at the center of the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S4)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から音声認識結果が引き渡されると,音声認識結果に従い処理を分岐する(S5)。特徴量抽出部22から引き渡された音声認識結果が,予め手続き実行部21に登録されているカテゴリーの場合,手続き実行部21は,特徴量抽出部22から引き渡された音声認識結果をカテゴリーとし,このカテゴリーに適合する資料を検索する電子図書館サービスを呼び出して(S6),このカテゴリーに適合する資料の検索結果をこの電子図書館サービスの実行結果として電子図書館サイト3から取得する(S7)。そして,電子図書館アプリケーション20の手続き実行部21は,電子図書館サービスの実行結果に対応する合成音声として,音声合成サーバ5を利用して,資料の検索結果に含まれる資料の件数を通知する合成音声を生成し,この合成音声をスピーカ27から音声出力して(S10),手続き実行部21が実行する手続きを資料選択手続きT2に遷移させる。
When the
また,特徴量抽出部22から引き渡された音声認識結果が,予め手続き実行部21に登録されているカテゴリー以外の場合,電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から引き渡された音声認識結果を検索キーワードとし,この検索キーワードに適合する資料を検索する電子図書館サービスを呼び出して(S8),この検索キーワードに適合する資料の検索結果をこの電子図書館サービスの実行結果として電子図書館サイト3から取得する(S9)。そして,電子図書館アプリケーション20の手続き実行部21は,電子図書館サービスの実行結果に対応する合成音声として,音声合成サーバ5を利用して,資料の検索結果に含まれる資料の件数を通知する合成音声を生成し,スピーカ27から合成音声を音声出力して(S10),手続き実行部21が実行する手続きを資料選択手続きT2に遷移させる。
If the speech recognition result delivered from the feature
図5は,電子図書館サイト3のトップページ6を説明する図である。図5で図示したトップページ6は,ページ移動することなく表示内容を変更するタブとして,3つのタブ,「新着」,「ランキング」,「マイページ」が含まれる。「新着」のタブ6aは,所定期間内に出版された新着を表示するタブで,「ランキング」のタブ6bは,所定期間内で貸出件数の多い資料をランキング形式で表示するタブで,「マイページ」のタブ6cは,ユーザに貸出している資料を少なくとも表示するタブである。例えば,音声認識結果が一致するカテゴリーが「新着」の場合,手続き実行部21は,「新着」のタブ6aが選択されたときの表示内容(所定期間内に出版された新着のリスト)を検索結果として電子図書館サイト3から取得する。また,図5で図示したトップページ6は,検索キーワードを入力する入力フォーム6dとキーワード検索を実行するボタン6eを有し,例えば,音声認識結果が「歴史」の場合,手続き実行部21は,入力フォーム6dに「歴史」が入力されたときのキーワード検索の検索結果を電子図書館サイト3から取得する。
FIG. 5 is a diagram illustrating the top page 6 of the electronic library site 3. The top page 6 illustrated in FIG. 5 includes three tabs, “New Arrival”, “Ranking”, and “My Page”, as tabs for changing the display contents without moving the page. The “New Arrival”
なお,図5において,「マイページ」のタブ6cは,ユーザが電子図書館サイト3にログインしている状態でのみ表示されるタブである。電子図書館サイト3にログインしている状態で,音声認識結果が一致するカテゴリーが「マイページ」の場合,手続き実行部21は,「マイページ」のタブ6cが選択されたときの表示内容を検索結果として電子図書館サイト3から取得する。
In FIG. 5, the “My Page”
図6は,資料選択手続きT2において,手続き実行部21が実行する処理を説明する図である。資料選択手続きT2において,電子図書館アプリケーション20の手続き実行部21は,資料検索手続きT1にて電子図書館サイト3から取得した検索結果に含まれるテキストを音声合成サーバ5に送信して,検索結果に含まれるテキストの合成音声を音声合成サーバ5から取得した後,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力する(S20)。
FIG. 6 is a diagram for explaining processing executed by the
電子図書館アプリケーション20の手続き実行部21は,電子図書館サイト3から取得した検索結果を音声出力すると,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S21),この時点に対応する音声ガイダンス(例えば,「選択する資料のタイトルまたは資料の番号を話してください。」)をスピーカ27から音声出力した後(S22),音声認識を指定して特徴量抽出部22を作動させる(S23)。
When the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S24)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から音声認識結果が引き渡されると,音声認識結果に従い処理を分岐する(S25)。特徴量抽出部22から引き渡された音声認識結果が,資料のタイトルまたは資料の番号の場合,手続き実行部21は,音声認識結果(ここでは,タイトルまたは番号)で特定される資料を選択状態にし(S28),手続き実行部21が実行する手続きを貸出手続きT3に遷移させる。
When the
また,電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から引き渡された音声認識結果が,資料のタイトルまたは資料の番号の以外の場合,特徴量抽出部22から引き渡された音声認識結果が,手続き実行部21に予め登録されている並び替えに係る単語であるか確認し,特徴量抽出部22から引き渡された音声認識結果が,並び替えに係る単語の場合,音声認識結果に対応する並び替えを実行する電子図書館サービスを呼び出し(S26),並び替え後の検索結果を電子図書館サイト3から取得して(S27),図6の先頭に戻る。また,特徴量抽出部22から引き渡された音声認識結果が,上述の単語以外の場合,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。
Further, the
図7は,資料の検索結果を表示する電子図書館サイト3のページ7を説明する図である。図7で図示したページ6では,「歴史」が検索キーワードとして入力され,「歴史」に適合する資料のリスト7aが検索結果として表示され,検索結果には,検索結果に含まれる資料毎に,資料の表紙画像,資料のタイトル,資料の著者名および資料の出版日が含まれる。また,図7で図示したページ7には,検索結果を並び替えるときに選択するボタンオブジェクト7bが含まれ,このボタンオブジェクト7bを選択することで,検索結果の並び替えとして,新着順,名昇順,名降順のいずれかを選択できるようになっている。
FIG. 7 is a diagram for explaining the page 7 of the electronic library site 3 that displays the search result of the material. In the page 6 illustrated in FIG. 7, “history” is input as a search keyword, and a
電子図書館アプリケーション20の手続き実行部21は,資料の検索結果として,資料のリスト7aの内容を取得し,資料のリスト7aに含まれるテキストを読み上げることになる。また,音声認識結果が歴史書2のタイトルの場合,手続き実行部21は,歴史書2を選択状態にする。また,音声認識結果が新着順の場合,手続き実行部21は,資料の検索結果を新着順に並び替える電子図書館サービスを呼び出す。
The
図8は,貸出手続きT3において,手続き実行部21が実行する処理を説明する図である。貸出手続きT3において,電子図書館アプリケーション20の手続き実行部21は,まず,電子図書館サイト3にログインしているか否かにより処理を分岐する(S30)。電子図書館アプリケーション20の手続き実行部21は,電子図書館サイト3へのログイン状況を内部情報として管理し,この内部情報を参照して,電子図書館サイト3にログインしているか否かを判断する。
FIG. 8 is a diagram for explaining processing executed by the
電子図書館アプリケーション20の手続き実行部21は,電子図書館サイト3にログインしていなければ,手続き実行部21が実行する手続きをログイン手続きT4に遷移させ,ログイン手続きT4に係る処理を実行する。また,手続き実行部21は,電子図書館サイト3にログインしていれば,資料の貸出状況を提供する電子図書館サービスを呼び出し(S31),資料選択手続きT2にて選択状態にした資料の貸出状況を電子図書館サイト3から取得し(S32),選択状態にした資料をユーザが既に借りているか否かにより処理を分岐させる(S33)。
If the
選択状態にした資料の貸出状況により,選択状態にした資料が貸出されており,かつ,この資料を借りている者がユーザ自身の場合,電子図書館アプリケーション20の手続き実行部21は,手続き実行部21が実行する手続きを再生手続きT5に遷移させる。
If the selected material is lent out according to the lending status of the selected material, and the person who borrows this material is the user himself, the
選択状態にした資料をユーザが借りていない場合,電子図書館アプリケーション20の手続き実行部21は,選択状態にした資料が貸出可能か否かにより処理を分岐させる(S34)。選択状態にした資料が貸出可能な場合,電子図書館アプリケーション20の手続き実行部21は,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S42),この時点に対応する音声ガイダンス(例えば,「資料を借りますか。」)をスピーカ27から音声出力した後(S43),音声認識を指定して特徴量抽出部22を作動させる(S44)。
If the user has not borrowed the selected material, the
特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S45)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果により処理を分岐させる(S46)。電子図書館アプリケーション20の手続き実行部21は,音声認識結果が肯定を示す単語(例えば,「はい」)の場合,資料を貸し出す電子図書館サービスを呼び出し(S47),資料を貸し出す電子図書館サービスの実行結果を電子図書館サイト3から受信すると,電子図書館サイト3から借りた資料,すなわち,資料選択手続きT2で選択状態にした資料のタイトルを音声合成サーバ5に送信して,資料のタイトルの合成音声を音声合成サーバ5から取得した後,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力し(S48),手続き実行部21が実行する手続きを再生手続きT5に遷移させる。なお,音声認識結果が肯定を示す単語でない場合,手続き実行部21は,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。
The
選択状態にした資料が貸出不可の場合,電子図書館アプリケーション20の手続き実行部21は,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S35),この時点に対応する音声ガイダンス(例えば,「資料を予約しますか。」)をスピーカ27から音声出力した後(S36),音声認識を指定して特徴量抽出部22を作動させる(S37)。
When the selected material cannot be lent out, the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S38)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果により処理を分岐させる(S39)。電子図書館アプリケーション20の手続き実行部21は,音声認識結果が肯定を示す単語の場合,資料を予約する電子図書館サービスを呼び出し(S40),資料を予約する電子図書館サービスの実行結果を電子図書館サイト3から受信すると,電子図書館サイト3に予約した資料,すなわち,資料選択手続きT2で選択状態にした資料のタイトルを音声合成サーバ5に送信して,資料のタイトルの合成音声を音声合成サーバ5から取得した後,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力し(S41),手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。なお,音声認識結果が肯定を示す単語でない場合,手続き実行部21は,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。
The
図9は,ログイン手続きT4において,手続き実行部21が実行する処理を説明する図である。ログイン手続きT4において,電子図書館アプリケーション20の手続き実行部21は,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S50),この時点に対応する音声ガイダンス(例えば,「ログインパスワードを話してください。」)をスピーカ27から音声出力した後(S51),音声認識と声紋認証を指定して特徴量抽出部22を作動させる(S52)。
FIG. 9 is a diagram for explaining processing executed by the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識結果を音声認識サーバ4から受信する。また,特徴量抽出部22は,ユーザがマイク24に入力した音声を声紋認識部に引き渡し,声紋認証結果を声紋認証部23から受信する。そして,特徴量抽出部22は,音声認証結果と声紋認証結果を手続き実行部21に引き渡し,手続き実行部21は,音声認識結果と声紋認証結果を取得する(S53)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から音声認識結果と声紋認証結果が引き渡しされると,まず,音声認識結果に従い処理を分岐する(S54)。手続き実行部21は,特徴量抽出部22から引き渡された音声認識結果が,予め手続き実行部21に登録されているログインパスワードと一致しない場合,ログインパスワードエラーを通知する音声ガイダンスをスピーカ27から音声出力した後(S55),図9の先頭に戻る。
When the speech recognition result and the voiceprint authentication result are delivered from the feature
また,特徴量抽出部22から引き渡された音声認識結果が,予め手続き実行部21に登録されているログインパスワードと一致する場合,電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から引き渡しされた声紋認証結果に従い処理を分岐する(S56)。手続き実行部21は,特徴量抽出部22から引き渡しされた声紋認証結果によって声紋認証の失敗が示される場合,声紋認証エラーを通知する音声ガイダンスをスピーカ27から音声出力した後(S57),図9の先頭に戻る。
If the speech recognition result delivered from the feature
電子図書館アプリケーション20の手続き実行部21は,特徴量抽出部22から引き渡しされた声紋認証結果によって声紋認証の成功が示される場合,手続き実行部21に登録されているユーザIDとログインパスワードとなる音声認証結果をパラメータとして,電子図書館サイト3にログインする電子図書館サービスを呼び出し(S58),電子図書館サイト3にログインする電子図書館サービスの実行結果を電子図書館サイト3から取得すると,ユーザIDが電子図書館サイト3にログインしたことを通知するテキストを音声合成サーバ5に送信して,このテキストの合成音声を音声合成サーバ5から取得した後,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力して(S59),手続き実行部21が実行する手続きを貸出手続きT3に遷移させる。
The
図10は,再生手続きT5において,手続き実行部21が実行する処理を説明する図である。再生手続きT5において,電子図書館アプリケーション20の手続き実行部21は,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S60),この時点に対応する音声ガイダンス(例えば,「借りている資料を読みますか。」)をスピーカ27から出力した後(S61),音声認識を指定して特徴量抽出部22を作動させる(S62)。
FIG. 10 is a diagram for explaining processing executed by the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S63)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果により処理を分岐させる(S64)。電子図書館アプリケーション20の手続き実行部21は,音声認識結果が肯定を示す単語でない場合,電子図書館操作フローの状態を資料検索手続きT1に遷移させる。また,音声認識結果が肯定を示す単語の場合,手続き実行部21は,資料のコンテンツを提供する電子図書館サービスを呼び出し(S65),資料のコンテンツを提供する電子図書館サービスの実行結果として,電子図書館サイト3から借りた資料のコンテンツを電子図書館サイト3から取得する(S66)。
The
電子図書館アプリケーション20の手続き実行部21は,資料のコンテンツを電子図書館サイト3から取得すると,電子図書館サイト3から取得した資料のコンテンツに含まれるテキストを音声合成サーバ5へ送信して,このテキストに対応する合成音声を取得し,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力することで,電子図書館サイト3から借りた資料を再生する(S67)。なお,手続き実行部21は,電子図書館サイト3から取得した資料の再生は,所定のページ数単位で行い,手続き実行部21は,資料の再生終了を実行すると,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。
When the
電子図書館アプリケーション20の手続き実行部21は,音声により資料の再生を操作できる機能に対応していることが好適である。電子図書館アプリケーション20の手続き実行部21は,音声により資料の再生を操作できる機能に対応している場合,電子図書館アプリケーション20の手続き実行部21は,資料を再生している間,ユーザの音声を受け付ける状態になり,ユーザがマイク24に入力した単語に対応する再生操作を実施する。なお,資料の再生操作としては,再生終了,一時停止および再生再開が考えられる。
The
図11は,資料返却手続きにおいて,手続き実行部21が実行する処理を説明する図である。図4において,「マイページ」のタブは,ユーザが電子図書館サイト3にログインしている状態でのみ有効なタブである。電子図書館サイト3にログインしている状態で,上述の資料検索手続きT1が実行され,音声認識結果が一致するカテゴリーが「マイページ」の場合,電子図書館アプリケーション20の手続き実行部21は,「マイページ」のタブが選択されたときの表示内容を検索結果として電子図書館サイト3から取得し,図11で図示した返却手続きT6に係る処理が実行可能になる。
FIG. 11 is a diagram illustrating processing executed by the
資料返却手続きにおいて,電子図書館アプリケーション20の手続き実行部21は,音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S70),資料返却手続きに対応する音声ガイダンス(例えば,「返却する資料を話してください」)をスピーカ27から音声出力した後(S71),音声認識を指定して特徴量抽出部22を作動させる(S72)。
In the document return procedure, the
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S73)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果により処理を分岐させる(S74)。特徴量抽出部22から引き渡された音声認識結果が,資料のタイトルまたは資料の番号でない場合,手続き実行部21は,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。また,特徴量抽出部22から引き渡された音声認識結果が,資料のタイトルまたは資料の番号のいずれかである場合,手続き実行部21は,音声認識結果(ここでは,タイトルまたは番号)で特定される資料を選択状態にしてから(S75),音声入力を開始する動作を受け付ける状態になり,音声入力を開始する動作を検知すると(S76),資料返却手続きに対応する音声ガイダンス(例えば,「選択された資料を返却しますか」)をスピーカ27から音声出力した後(S77),音声認識を指定して特徴量抽出部22を作動させる(S78)。
The
電子図書館アプリケーション20の特徴量抽出部22は,ユーザがマイク24に音声を入力すると,ユーザがマイク24に入力した音声の特徴量を抽出し,抽出した特徴量を音声認識サーバ4に送信した後,音声認識サーバ4から受信した音声認識結果を手続き実行部21に引き渡し,手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果を取得する(S79)。
When the user inputs voice to the
電子図書館アプリケーション20の手続き実行部21は,ユーザがマイク24に入力した音声の音声認識結果により処理を分岐させる(S80)。電子図書館アプリケーション20の手続き実行部21は,音声認識結果が肯定を示す単語の場合,特徴量抽出部22から音声認識結果が引き渡されると,資料を返却する電子図書館サービスを呼び出し(S81),音声認識結果で特定される資料を電子図書館サイト3へ返却し,資料を返却する電子図書館サービスの実行結果を電子図書館サイト3から受信すると,電子図書館サイト3に返却した資料のタイトルを音声合成サーバ5に送信して,資料のタイトルの合成音声を音声合成サーバ5から取得した後,音声合成サーバ5から取得した合成音声をスピーカ27から音声出力して(S82),手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。なお,音声認識結果が肯定を示す単語でない場合,手続き実行部21は,手続き実行部21が実行する手続きを資料検索手続きT1に遷移させる。
The
1 電子図書館システム
2 携帯端末
20 電子図書館アプリケーション
21 手続き実行部
22 特徴量抽出部
23 声紋認証部
24 マイク
25 モーションセンサ
26 タッチパネル
27 スピーカ
3 電子図書館サイト
4 音声認識サーバ
5 音声合成サーバ
DESCRIPTION OF
Claims (7)
前記電子図書館サイトが提供している前記電子図書館サービスを利用するアプリケーションプログラムを実装した携帯端末と,
前記携帯端末から音声の特徴量を受信すると,音声の特徴量を用いて音声認識を行い,音声認識により得られたテキスト形式の音声認識結果を前記携帯端末へ送信する音声認識サーバと,
前記携帯端末からテキストを受信すると,このテキストの合成音声を生成して前記携帯端末へ送信する音声合成サーバと
から少なくとも構成された電子図書館システムであって,
前記アプリケーションプログラムが起動することによって前記携帯端末は,
ユーザがマイクに入力した音声の特徴量を抽出して,音声の特徴量を前記音声認識サーバに送信し,ユーザがマイクに入力した音声に対応する音声認識結果を前記音声認識サーバから取得する特徴量抽出部と,
前記電子図書館サイトの操作に係る手続きとその実行順序を記述した電子図書館操作フローが登録され,前記電子図書館操作フローに記述されている前記手続きを実行する際,音声入力を開始する動作を検知すると,前記特徴量抽出部を作動させて,ユーザがマイクに入力した音声の音声認識結果を前記特徴量抽出部から取得した後,前記特徴量抽出部から取得した音声認識結果を利用して,この時点の前記手続きに対応する前記前記電子図書館サービスを呼び出し,呼び出した前記前記電子図書館サービスの実行結果を前記電子図書館サイトから受信すると,前記音声合成サーバを利用して,前記電子図書館サイトから受信した実行結果に対応する合成音声を生成して音声出力する手続き実行部を備える,
ことを特徴とする電子図書館システム。 Provide various electronic library services that can be used via the network, and upon receiving a call request for an electronic library service, execute the electronic library service that has received the call request, and provide a device that has requested the electronic library service to be called An electronic library site for transmitting the execution result of the electronic library service;
A mobile terminal in which an application program using the electronic library service provided by the electronic library site is installed;
A voice recognition server that receives voice feature values from the portable terminal, performs voice recognition using the voice feature values, and transmits a voice recognition result in a text format obtained by voice recognition to the portable terminal;
An electronic library system comprising at least a voice synthesis server that receives a text from the portable terminal and generates a synthesized voice of the text and transmits the synthesized voice to the portable terminal,
When the application program starts, the portable terminal
A feature that extracts a feature amount of voice input by a user to a microphone, transmits the feature amount of voice to the voice recognition server, and acquires a voice recognition result corresponding to the voice input by the user to the microphone from the voice recognition server. A quantity extraction unit;
When an electronic library operation flow describing the procedure related to the operation of the electronic library site and its execution order is registered, and when the procedure described in the electronic library operation flow is executed, an operation to start voice input is detected , By operating the feature amount extraction unit to acquire the speech recognition result of the voice input by the user to the microphone from the feature amount extraction unit, and then using the speech recognition result acquired from the feature amount extraction unit, The electronic library service corresponding to the procedure at the time is called, and when the execution result of the called electronic library service is received from the electronic library site, it is received from the electronic library site using the speech synthesis server. It has a procedure execution unit that generates synthesized speech corresponding to the execution result and outputs it.
An electronic library system characterized by this.
請求項4から請求項6のいずれか一つに記載した電子図書館システム。
When the application program is activated, the portable terminal includes a voice print authentication unit that authenticates a voice print of a voice input by a user to the microphone, and the procedure execution unit is configured to perform a voice test of the voice input by the user to the microphone in the login procedure. Calling the electronic library service for logging into the electronic library site only when the voiceprint authentication unit succeeds in voiceprint authentication,
The electronic library system according to any one of claims 4 to 6.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015105186A JP6485214B2 (en) | 2015-05-25 | 2015-05-25 | Electronic library system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015105186A JP6485214B2 (en) | 2015-05-25 | 2015-05-25 | Electronic library system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016218881A JP2016218881A (en) | 2016-12-22 |
JP6485214B2 true JP6485214B2 (en) | 2019-03-20 |
Family
ID=57581208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015105186A Active JP6485214B2 (en) | 2015-05-25 | 2015-05-25 | Electronic library system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6485214B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107507615A (en) * | 2017-08-29 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | Interface intelligent interaction control method, device, system and storage medium |
KR102020632B1 (en) * | 2018-06-26 | 2019-09-10 | 김용욱 | System for smart library |
JP6700531B1 (en) * | 2020-01-20 | 2020-05-27 | 株式会社白紙とロック | Authentication method, authentication system, smart speaker and program |
KR102403873B1 (en) * | 2021-11-30 | 2022-05-31 | 김민재 | Book location notification system, control method of book location notification system and computer program stored in a recording medium to execute the method |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07152787A (en) * | 1994-01-13 | 1995-06-16 | Sony Corp | Information access system and recording medium |
JP2000250574A (en) * | 1999-03-03 | 2000-09-14 | Sony Corp | Contents selection system, contents selection client, contents selection server and contents selection method |
JP2001306757A (en) * | 2000-04-20 | 2001-11-02 | Nec Corp | Service providing method |
JP2003188948A (en) * | 2001-12-19 | 2003-07-04 | Nec Corp | Portable terminal device |
JP2008051882A (en) * | 2006-08-22 | 2008-03-06 | Canon Inc | Speech information processing apparatus and its control method |
US20130325581A1 (en) * | 2012-06-05 | 2013-12-05 | 3M Innovative Properties Company | In-library lending activation |
JP6163834B2 (en) * | 2013-03-29 | 2017-07-19 | 富士通株式会社 | Book management apparatus, book management program, and book management method |
-
2015
- 2015-05-25 JP JP2015105186A patent/JP6485214B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016218881A (en) | 2016-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102100742B1 (en) | Remote extension of digital assistant services | |
KR101983003B1 (en) | Intelligent automated assistant for media exploration | |
CN109328381B (en) | Detect the triggering of digital assistants | |
KR102667413B1 (en) | Method and Apparatus for Executing Application based on Voice Command | |
CN114374661B (en) | Method, electronic device, and computer-readable medium for operating a digital assistant in an instant messaging environment | |
CN105264485B (en) | Content is provided in multiple equipment | |
CN104937603B (en) | terminal, unlocking method and program | |
CN110364148A (en) | Natural assistant's interaction | |
CN108292203A (en) | Active assistance based on equipment room conversational communication | |
WO2015178078A1 (en) | Information processing device, information processing method, and program | |
CN108604449A (en) | speaker identification | |
CN107615276A (en) | Virtual assistant for media playback | |
JP6485214B2 (en) | Electronic library system | |
CN110297679A (en) | For providing the equipment, method and graphic user interface of audiovisual feedback | |
CN107615378A (en) | Equipment Voice command | |
JP5907231B1 (en) | INPUT INFORMATION SUPPORT DEVICE, INPUT INFORMATION SUPPORT METHOD, AND INPUT INFORMATION SUPPORT PROGRAM | |
CN110097883A (en) | For accessing the interactive voice of the call function of corollary equipment at main equipment | |
CN104660819B (en) | Mobile device and the method for accessing file in mobile device | |
JP6296193B2 (en) | INPUT INFORMATION SUPPORT DEVICE, INPUT INFORMATION SUPPORT METHOD, AND INPUT INFORMATION SUPPORT PROGRAM | |
JP2005209024A (en) | Operation support apparatus and operation support method | |
JP6112239B2 (en) | INPUT INFORMATION SUPPORT DEVICE, INPUT INFORMATION SUPPORT METHOD, AND INPUT INFORMATION SUPPORT PROGRAM | |
DK179465B1 (en) | Intelligent automated assistant for media exploration | |
KR20100006495A (en) | Method and apparatus for providing internet web-page using voice recognition | |
US12010386B2 (en) | System and method for providing digital graphics and associated audiobooks | |
JP2016119107A (en) | Information input support apparatus, information input support method and information input support program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6485214 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |