JP2013174718A - 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム - Google Patents

音声記録選択装置、音声記録選択方法及び音声記録選択プログラム Download PDF

Info

Publication number
JP2013174718A
JP2013174718A JP2012038955A JP2012038955A JP2013174718A JP 2013174718 A JP2013174718 A JP 2013174718A JP 2012038955 A JP2012038955 A JP 2012038955A JP 2012038955 A JP2012038955 A JP 2012038955A JP 2013174718 A JP2013174718 A JP 2013174718A
Authority
JP
Japan
Prior art keywords
unit
work
voice
character string
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012038955A
Other languages
English (en)
Other versions
JP5426706B2 (ja
Inventor
Hisao Setoguchi
久雄 瀬戸口
Kazunari Ouchi
一成 大内
Sawa Fukuya
佐和 福家
Kenta Cho
健太 長
Tomoko Murakami
知子 村上
Kentaro Torii
健太郎 鳥居
Naoshi Uchihira
直志 内平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012038955A priority Critical patent/JP5426706B2/ja
Publication of JP2013174718A publication Critical patent/JP2013174718A/ja
Application granted granted Critical
Publication of JP5426706B2 publication Critical patent/JP5426706B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】音声から変換された文字列を特定の作業における重要度に応じて区別して出力することができる音声記録選択装置を提供する。
【解決手段】音声記録選択装置1は、音声受入部30と、音声認識部32と、作業認識部35と、記憶部36と、重要度判定部37と、出力部38と、を有する。音声受入部は、音声を受入れる。音声認識部は、音声を認識して文字列に変換する。作業認識部は、開始時刻及び終了時刻が定められた特定作業を示す作業情報を認識する。記憶部は、特定作業において重要な文字列及び文字列の属性の少なくともいずれかと、特定作業での文字列と属性の重要度と、を特定作業に対応付けた対応辞書を記憶する。重要度判定部は、作業情報及び対応辞書に基づいて、特定作業の開示時刻から終了時刻までの期間に受入れられた音声から変換された文字列の重要度を判定する。出力部は、文字列を重要度に応じて区別して出力する。
【選択図】図2

Description

本発明の実施形態は、音声記録選択装置、音声記録選択方法及び音声記録選択プログラムに関する。
従来、業務上の情報などを音声で記録することが知られている。音声を記録した利用者は、音声を再生することによって業務上の情報などを遡って確認することができる。
特開2010−191802号公報 特許第4693494号公報
Ling Bao and Stephen S.Intille、「Activity Recognition from User-Annotated Acceleration Data」、(米国)、Massachusetts Institute of Technology
しかしながら、業務記録の基となる情報をメモに代えて業務中の音声で記録し、記録した音声から業務記録を作成する場合などには、音声を記録していた業務時間(記録時間)と同等の時間をかけて音声を再生する必要があった。
実施形態の音声記録選択装置は、音声受入部と、音声認識部と、作業認識部と、記憶部と、重要度判定部と、出力部と、を有する。音声受入部は、音声を受入れる。音声認識部は、音声を認識して文字列に変換する。作業認識部は、開始時刻及び終了時刻が定められた特定の作業を示す作業情報を認識する。記憶部は、特定の作業において重要な文字列及び文字列の属性の少なくともいずれかと、特定の作業における文字列及び属性の重要度と、を特定の作業に対応付けた対応辞書を記憶する。重要度判定部は、作業情報及び対応辞書に基づいて、特定の作業の開示時刻から終了時刻までの期間に受入れられた音声から変換された文字列の重要度を判定する。出力部は、開示時刻から終了時刻までの期間に受入れられた音声から変換された文字列を、重要度に応じて区別して出力する。
実施形態にかかる音声記録選択装置のハードウェア構成図。 実施形態にかかる音声記録選択装置の機能ブロック図。 音声記録部が行う処理例を示すグラフ。 看護師の行動の区分を例示する図表。 対応モデルの構成例を示す図表。 対応辞書の構成例を示す図表。 重要度判定部が判定した結果を表示部が表示した場合の第1の表示例。 重要度判定部が判定した結果を表示部が表示した場合の第2の表示例。 実施形態にかかる音声記録選択装置の動作のフローチャート。
以下に添付図面を参照して、音声記録選択装置の実施の形態を詳細に説明する。図1は、実施形態にかかる音声記録選択装置1の構成を例示するハードウェア構成図である。図1に示すように、音声記録選択装置1は、例えば操作部20、マイク21、検知部22、スピーカ23、通信部24、記憶部25及び制御部26を有するコンピュータとしての機能を備えた携帯端末装置である。例えば、音声記録選択装置1は、スマートフォンなどであってもよい。
音声記録選択装置1は、例えば看護業務に従事する看護師などの利用者の腰などに装着され、利用者の行動時の音声を時刻とともに記録し、利用者の行動に応じて変化する情報などを検知して時刻とともに記憶する。また、音声記録選択装置1は、利用者の行動に応じて変化する情報の検知結果を用いて、利用者が行った作業などの行動を認識(推定)する。なお、実施の形態の音声記録選択装置1は、看護業務を行う看護師が利用者となる場合を例に説明するが、これに限られることなく、例えば1日程度のある程度まとまった時間にわたる業務を終えた後に、1日の業務記録を作成する他の業務を行う者が利用者であってもよい。
次に、音声記録選択装置1を構成する各部について詳述する。操作部20は、利用者の操作入力を受け入れる入力部200と、音声記録選択装置1の動作結果などを表示する表示部202とを有する。操作部20は、タッチパネルなどにより、入力部200と表示部202とが一体化されていてもよい。
マイク21は、例えば音声記録選択装置1の機能(又は電源)がオンにされると、音声等を受入れる。なお、マイク21は、受入れた音声をデジタルデータに変換する機能なども有しているものとする。また、マイク21は、指向性の強いマイクで構成されてもよいし、環境音の影響を低減させるために音声記録選択装置1の外部に設けられ、利用者の口元などに配置されるように構成されてもよい。
検知部22は、例えば加速度センサ220及び測位センサ222などを含み、利用者の行動に応じて変化する情報を検知する。加速度センサ220は、例えばMEMS(Micro Electro Mechanical System)により加速度センサの機能を実現されたものであってもよい。加速度センサ220は、利用者の動きに応じて変化する加速度を検出することにより、対象者の動き(加速度)を検知する。例えば、加速度センサ220は、音声記録選択装置1の機能(又は電源)がオンにされると、加速度を連続的に検知する。
測位センサ222は、例えばGPS(Global Positioning System;全地球測位システム)機能により利用者の位置を検知する。ただし、測位センサ222の機能は、後述するWi−Fi(登録商標)のアクセスポイント又はBluetooth(登録商標)機器などが発信する機器識別情報を含んだビーコン情報を利用して代替えされてもよい。また、測位センサ222の機能は、屋内に設置された機器からGPSの測位情報に相当する信号を発することにより測位を可能にするIMES(Indoor MEssaging System)を利用して構成されてもよい。また、測位センサ222の機能は、携帯電話の通信網を用いて基地局の位置情報を利用することにより実現されてもよい。
また、検知部22は、利用者の行動に応じて変化する利用者の脈拍を検知する脈拍検知部を備えていてもよい。さらに、検知部22は、利用者の行動に影響を与える環境温度を検知する温度検知部を備えていてもよい。つまり、検知部22は、利用者の行動に応じて変化する他の情報、及び利用者の行動に影響を与える他の情報をより多く検知し、利用者の行動(作業など)の認識の精度を向上可能にするように構成されてもよい。なお、検知部22は、機能の全て又は一部が音声記録選択装置1の外部に設けられ、検知結果を制御部26に対して送信するように構成されてもよい。
スピーカ23は、入力部200を介して入力される利用者の操作などに応じて、音声などを出力する。なお、スピーカ23は、音声を出力するために必要なデータ変換の機能なども有しているものとする。
通信部24は、外部との通信を行う汎用のインターフェイスであり、例えば有線通信、長距離無線通信及び近接無線通信のいずれに対しても接続可能に構成されている。具体的には、通信部24は、Wi−Fi(登録商標)により相互接続性が保証されている複数のアクセスポイントを有する無線LAN(Local Area Network)に接続可能にされている。また、通信部24は、携帯電話網、Bluetooth(登録商標)、RFID(Radio Frequency IDentification)、USB(Universal Serial Bus)及び有線LANなどを利用して通信を行うように構成されている。
記憶部25は、図示しないROM(Read Only Memory)、RAM(Random Access Memory)及びフラッシュメモリ(Flash memory)などを有する。そして、記憶部25は、音声記録選択装置1が実行するプログラムや、音声記録選択装置1がプログラムを実行する場合に使用するデータ(後述する対応モデル34及び対応辞書36)などを記憶する。また、記憶部25は、マイク21が受入れた音声、加速度センサ220が検出した加速度のデータ、測位センサ222が検出した位置情報(又はアクセスポイント情報等)などもそれぞれ時刻を示す情報(時刻データ)とともに記憶する。また、音声記録選択装置1には、記憶部25との間でプログラム及びデータを送受可能にされたメモリカードなどの記憶媒体250が着脱自在に設けられている。
制御部26は、例えばCPU260を含み、音声記録選択装置1を構成する各部を制御する。
次に、音声記録選択装置1が有する機能について説明する。図2は、実施形態にかかる音声記録選択装置1が有する機能の概要を例示する機能ブロック図である。図2に示すように、音声記録選択装置1は、音声受入部30、音声記録部31、音声認識部32、情報検知部33、対応モデル34、作業認識部35、対応辞書36、重要度判定部37及び出力部38を有する。
音声受入部30は、マイク21(図1)などにより構成され、音声記録選択装置1の機能(又は電源)がオンにされると、音声を受入れて音声記録部31及び音声認識部32に対して出力する。
音声記録部31は、制御部26及び記憶部25などにより構成され、音声受入部30から受入れた音声を時刻とともに記録(記憶)する。図3は、音声記録部31が行う処理例を示すグラフである。図3に示すように、音声記録部31は、例えば16ビットの整数値で表現されるPCM(Pulse Code Modulation;パルス符号変調)データの音声データを音声受入部30から受入れる。音声記録部31は、音声受入部30から受入れた音声データの全て、又は有用な音声データだけを記憶する。
本実施形態においては、音声記録部31は、図3に示すように、受入れる音声データ(音声波形)の大きさに対して閾値を設け、音声データの大きさが閾値未満である場合は環境音などの有用でないデータ又は無音であるとして、利用者が音声を発していないとみなす。つまり、音声記録部31は、大きさが閾値以上である音声データのみを利用者の音声データとする。
このように、音声記録部31は、音声受入部30から受入れた音声データを無音期間と有用な連続音声期間とに区別し、有用な連続音声期間ごとに分割された音声データを時刻データとともに記録する。つまり、音声記録部31が記録する音声データには、連続音声期間の開始時刻と終了時刻も含まれる。なお、音声期間の検出方法は、短時間パワーを用いて、利用者の音声データを検出してもよく、限定されない。
音声認識部32は、制御部26及び記憶部25などにより構成され、音声受入部30から受入れた音声データを認識してテキスト(文字列)に変換し、音声が発せられた時刻を示す情報を対応付けた文字列を重要度判定部37に対して出力する。音声認識部32は、例えばLVCSR(Large-Vocabulary Continuous Speech Recognition;大語彙連続音声認識)エンジンを含む。また、音声認識部32は、利用者の業務に特化した単語辞書、音響モデル及び言語モデルを有していてもよい。
情報検知部33は、例えば加速度センサ220を含む加速度検知部330、及び測位センサ222を含む位置検知部332を有し、利用者の加速度及び位置を検知して、作業認識部35に対して出力する。また、情報検知部33は、利用者の脈拍を検知する脈拍検知部334、及び利用者が位置する環境の温度を検知する温度検知部336など他の情報も検知して、作業認識部35に対して出力するように構成されてもよい。利用者の脈拍は、利用者が急いで作業を行った場合に変化することが考えられるため、利用者の作業を認識する場合に利用可能である。また、利用者が看護師である場合、看護師が位置する環境の温度は、患者の健康状態の変化に応じて生じる看護師の作業を認識する場合などに利用可能である。
対応モデル34は、利用者が行った特定の作業を作業認識部35が情報検知部33の検知結果を用いて認識するために使用するモデルであり、例えば記憶部25に記憶されている。以下、作業認識部35が加速度検知部330及び位置検知部332の検知結果を用いて利用者が行った特定の作業を認識する場合を例に説明する。
まず、利用者の行動の区分について説明する。図4は、看護師の行動の区分を例示する図表である。図4に示すように、看護師の行動は、例えば業務、作業及び動作に区分される。看護師の行動には、例えば患者の回診業務及び看護業務などの複数の業務が定められているものとする。また、作業は、業務中に発生する小さな仕事を指すものとする。また、動作は、作業中に発生する「姿勢変更」、「手を動かす」及び「手を止める」などの利用者の具体的な動きを指すものとする。つまり、図4に例示するように、利用者の行動は、業務(「患者の回診」)が複数の作業(「体の向き変更」、「衣服をはがす」など)により構成され、作業が複数の動作(「姿勢変更」、「手を動かす」、「解く」など)により構成されるという階層構造で表されるものとする。作業は複数の動作から認識され、業務は複数の作業から認識される。
看護業務においては、患者の診察を行う場合に、看護師は両手を使って患者の体を起こすという作業が発生することがある。この場合、看護師は、看護業務の業務記録を作成するために必要となる情報を紙に記載することが困難である。具体的には、看護師は、両手を使っている場合には、患者の傷の大きさや状態などの情報を紙に記載するために、筆記具を用いることは困難である。そこで、看護師は、情報を紙に記載することに代えて、音声記録選択装置1に音声を記録する。
図5は、対応モデル34の構成例を示す図表である。図5に示すように、対応モデル34は、例えば動作のパターン50、位置52、時間54の情報が、作業名56の情報に対応付けられている。例えば、対応モデル34は、「かがむ」、「止まる」、「起こす」の順序の動作(動作パターン)が行われ、この動作パターンが「病室」で行われたものであり、且つ動作パターンが行われるのに要した時間が「1分」以内であった場合、利用者である看護師の作業は「患者の体を起こす」であったと対応付けるモデルである。また、対応モデル34は、動作の繰り返しや、一定時間内の動作の発生比率などによっても特定の作業が対応付けられるように構成されている。なお、利用者の行動は、対応モデル34によって特定の作業に対応付けられると、作業名56に示された作業名のいずれかも定められる。
作業認識部35(図2)は、制御部26などにより構成され、加速度検知部330が検知した時刻が対応付けられた加速度データを受入れて、まず利用者の時刻を対応付けられた動作を認識する。次に、作業認識部35は、認識した動作と、位置検知部332が検知した利用者の時刻を対応付けられた位置データと、対応モデル34とを用いて利用者の時刻を対応付けられた作業を認識する。つまり、作業認識部35は、動作及び作業それぞれの開始時刻及び終了時刻も認識する。
例えば、作業認識部35は、図5に示された「患者の体を起こす」という作業を認識する場合、まず、「かがむ」、「止まる」、「起こす」という動作を認識する。ここで、作業認識部35は、「かがむ」の動作に対応する加速度データの開始時刻が時刻tsである場合、「かがむ」の動作の開始時刻を時刻tsとする。
作業認識部35は、「かがむ」の動作に続いて、「止まる」、「起こす」の動作を認識し、「起こす」の動作に対応する加速度データの終了時刻が時刻teである場合、「起こす」の動作の終了時刻を時刻teとする。
そして、作業認識部35は、「かがむ」、「止まる」、「起こす」の一連の動作を「患者の体を起こす」の作業と認識すると、「患者の体を起こす」の作業の開始時刻を時刻tsとし、作業の終了時刻を時刻teとする。
対応辞書36(図2)は、作業認識部35が認識した特定の作業において、音声認識部32が認識した音声データの文字列としての重要度を重要度判定部37が判定するために使用する辞書であり、例えば記憶部25に記憶されている。
図6は、対応辞書36の構成例を示す図表である。対応辞書36は、特定の作業において重要な文字列(例えばキーワード)及び文字列の属性の少なくともいずれかが、特定の作業に対応付けられている。図6において、「<数字>」のように、「<」と「>」で囲まれた文字列は、その文字列が示すクラスに属するキーワード(属性が同じキーワード)であれば任意の文字列が対応付けられることを表す。
例えば、「<数字>」が示す部分には数字を示す任意の文字列が対応付けられる。つまり、対応辞書36は、「傷の大きさを測る」という作業に認識された期間に、「10センチ」という認識された文字列が対応付けられると(「10センチ」という音声が発せられていると)、「10センチ」という文字列は重要度が高い文字列であると判定されるように構成されている。また、作業の種類によって音声(文字列)の重要度が異なるため、対応辞書36は、同一の文字列であっても対応付けられる作業によって重要度が異なる判定を可能にしている。
なお、図6においてキーワードとして挙げられている文字列は、活用又は変形されても作業に対応付けられるように、活用例又は変形例を合わせて列挙されたり、活用又は変形の定義付けをされてもよい。また、図6においては、対応辞書36は、特定の作業に対して重要度が同レベルである文字列及び文字列の属性の少なくともいずれかが対応付けられているが、特定の作業に対して重要度のレベルが異なる複数のレベルの文字列及び文字列の属性の少なくともいずれかが区別されて対応付けられていてもよい。
重要度判定部37(図2)は、制御部26などにより構成される。重要度判定部37は、作業認識部35が認識した特定の作業(作業の期間)において、音声認識部32が認識した音声データの文字列としての重要度を、対応辞書36を用いて判定し、判定結果を出力部38に対して出力する。例えば、重要度判定部37は、作業認識部35が「傷の大きさを測る」という作業に認識した期間に対し、音声認識部32が「10センチ」という文字列を認識した場合、対応辞書36に従って「10センチ」という文字列は重要度が高いと判定する。
一方、重要度判定部37は、音声認識部32が「10センチ」という文字列を認識しても、作業認識部35が認識した作業が「傷の大きさを測る」という作業でなければ、「10センチ」という文字列の重要度が高いとは判定しない。
出力部38は、重要度判定部37が判定した結果を受入れて出力する。ここで、出力部38は、図1に示した表示部202であってもよい。つまり、出力部38は、重要度判定部37が判定した結果を表示することによって出力してもよい。
また、出力部38は、通信部24(図1)であってもよい。つまり、出力部38は、重要度判定部37が判定した結果を例えば外部のPC(Personal Computer)などに対して送信することによって出力してもよい。そして、利用者は、外部のPCを用いて重要度判定部37の判定結果を表示させたり、加工するようにしてもよい。
(第1の表示例)
図7は、重要度判定部37が判定した結果を表示部202が表示した場合の第1の表示例である。図7に示すように、表示部202は、重要度判定部37の判定結果を受けると、認識(推定)した作業を時系列に表示する。また、表示部202は、時系列に表示した作業に対応する文字列を、作業と文字列とが対応するように配置し、例えば音声が発せられた順に上から下へ並べて表示する。
また、表示部202は、特定の作業ごとに、文字列を重要度に応じて区別して表示する。例えば、表示部202は、「304号室_傷の大きさを測る」(作業A)において、重要度の高い文字列102(「赤くなってる」)及び文字列104(「10センチ」)を、文字列100及び文字列106に対して強調して表示する。表示部202は、文字列の色を変えたり、太さや大きさを変えることにより、表示の強調を行う。また、表示部202は、「304号室_薬を塗る」(作業B)において、重要度の高い文字列110(「○○(薬の名前)」)及び文字列114(「ガーゼ貼った」)を、文字列108、文字列112及び文字列116に対して強調して表示する。
ここで、作業Aにおける文字列102と、作業Bにおける文字列108とは、いずれも文字列の属性が<色み>であり、赤色を示す文字列となっている。しかし、作業Aにおいて赤色を示す文字列の重要度が高くても、作業Bにおいて赤色を示す文字列の重要度が高くないため、表示部202は、文字列102と文字列108とに対して異なる表示をしている。
なお、音声記録選択装置1(図2)は、図1によってハードウェア構成を例示したように、利用者の操作入力を受け入れる機能を備えた操作受入部40、及び音声などを出力する機能を備えた音声出力部41を有していてもよい。
また、表示部202は、複数の作業の中から操作受入部40を介して選択された1つの作業に対応する文字列だけを表示するなど、操作受入部40を介して入力される操作に応じて任意の選択された表示を行うように構成されてもよい。
(第2の表示例)
図8は、重要度判定部37が判定した結果を表示部202が表示した場合の第2の表示例である。なお、図8に示した第2の表示例は、通信部24(図1)を介して外部のPCなどに表示されるものであってもよい。また、第2の表示例に示された操作入力に伴う表示等も、外部のPCなどの操作入力に応じて表示等される(表示以外の動作も含む)ものであってもよい。
図8に示すように、表示部202は、重要度判定部37の判定結果を受けると、音声データの連続音声期間(図3参照)、認識(推定)した作業及び業務を時系列に対応付けて表示する。なお、図8において、図7に示した作業と同一の作業には、同一の符号が付してある。
図8(a)に示すように、例えば、作業Aの期間には連続音声期間d1、d2が対応付けられ、作業Bの期間には連続音声期間d3〜d6が対応付けられている。表示部202は、作業Aの開始時刻に開始時刻表示70を表示し、作業Aの終了時刻に終了時刻表示72を表示する。また、表示部202は、作業Bの開始時刻に開始時刻表示74を表示し、作業Bの終了時刻に終了時刻表示76を表示する。開始時刻表示70、74及び終了時刻表示72、76は、例えば操作受入部40を介して入力される操作に応じてポインタ60によりスライドさせられて、それぞれの時刻を前後に変更可能にされている。つまり、音声記録選択装置1は、利用者が操作受入部40を介して開始時刻表示70、74及び終了時刻表示72、76を移動させることにより、作業A、Bの開始時刻及び終了時刻の表示及び時刻データを変更可能にされている。
例えば、作業Bの期間においては、連続音声期間d3の開始時刻が作業Bの開始時刻とされており、連続音声期間d6の終了時刻が作業Bの終了時刻とされている。図8(a)に示すように、終了時刻表示76が表示部202上でスライドさせられると、音声記録選択装置1は、作業Bの終了時刻を変更する処理を行う。
また、作業Aの終了時刻は、連続音声期間d2の終了時刻と一致していない。つまり、図8(a)は、終了時刻表示72が移動させられた結果、連続音声期間の終了時刻にかかわらず、作業Aの終了時刻が変更された状態を示している。
図8(b)は、終了時刻表示76が表示部202上でスライドさせられた場合の音声記録選択装置1の動作を例示している。例えば、終了時刻表示76が時刻を前倒しする方向にスライドさせられ、連続音声期間d6の表示に重ねられると、音声記録選択装置1は、音声記録部31が記録している音声データから連続音声期間d6に発せられた音声データを選択する。そして、音声記録選択装置1は、連続音声期間d6に発せられた音声データを用いて、音声出力部41による音声出力を行う。
また、音声記録選択装置1は、終了時刻表示76が時刻を前倒しする方向にスライドさせられ、作業Bの表示に重ねられると、音声記録部31が記録している音声データから作業Aの期間に発せられた音声データ(連続音声期間d3〜d6の音声データ)を選択するように構成されてもよい。そして、音声記録選択装置1は、連続音声期間d3〜d6に発せられた音声データを用いて、音声出力部41による音声出力を行う。
音声記録選択装置1は、作業の開始時刻又は終了時刻が変更された場合、開始時刻又は終了時刻が変更された作業に対して文字列の重要度の判定を改めて行うように構成されてもよい。また、表示部202は、第2の表示例が表示する情報に加えて、第1の表示例で表示した文字列を表示するように構成されてもよい。
次に、音声記録選択装置1の動作について説明する。図9は、実施形態にかかる音声記録選択装置1の動作を例示するフローチャートである。音声記録選択装置1は、例えば電源がオンにされると、音声受入部30が音声の受入れを開始し、情報検知部33が検知を開始する。
図9に示すように、ステップ100(S100)において、音声認識部32は、音声受入部30が受入れた音声を認識し、時刻が対応付けられた文字列(テキスト)に変換する。
ステップ102(S102)において、作業認識部35は、情報検知部33が検知した加速度データ及び位置データなどを受入れて、利用者の時刻を対応付けられた作業(作業情報)を認識する。
ステップ104(S104)において、重要度判定部37は、作業認識部35が認識した作業(作業の期間)において、音声認識部32が認識した文字列としての重要度を、対応辞書36を用いて判定する。
ステップ106(S106)において、表示部202は、重要度判定部37が判定した結果を受入れ、テキストを重要度に応じて区別して表示する。
本実施形態においては、情報検知部33の検知結果を用いて特定の作業を認識し、認識した作業に対して音声認識部32が認識した文字列の重要度を判定する場合を例に説明したが、音声記録選択装置1の動作はこれに限定されない。例えば、音声記録選択装置1は、開始時刻及び終了時刻が定められた特定の作業を示す予定表などのデータ(作業情報)を作業認識部35が読み込み、予定表に示される作業に対して音声認識部32が認識した文字列の重要度を重要度判定部37が判定するように構成されてもよい。また、音声記録選択装置1が音声を記録して文字列の重要度を判定する言語は、日本語に限らず、他の言語であってもよい。
以上説明した実施形態によれば、音声を記録していた記録時間と同等の時間をかけることなく、音声から変換された文字列を特定の作業における重要度に応じて区別して出力することができる。
また、本発明の実施形態を複数の組み合わせによって説明したが、これらの実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規の実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 音声記録選択装置
20 操作部
200 入力部
202 表示部
21 マイク
22 検知部
220 加速度センサ
222 測位センサ
23 スピーカ
24 通信部
25 記憶部
26 制御部
30 音声受入部
31 音声記録部
32 音声認識部
33 情報検知部
330 加速度検知部
332 位置検知部
334 脈拍検知部
336 温度検知部
34 対応モデル
35 作業認識部
36 対応辞書
37 重要度判定部
38 出力部
40 操作受入部
41 音声出力部











Claims (8)

  1. 音声を受入れる音声受入部と、
    前記音声を認識して文字列に変換する音声認識部と、
    開始時刻及び終了時刻が定められた特定の作業を示す作業情報を認識する作業認識部と、
    前記特定の作業において重要な文字列及び文字列の属性の少なくともいずれかと、前記特定の作業における前記文字列及び前記属性の重要度と、を前記特定の作業に対応付けた対応辞書を記憶する記憶部と、
    前記作業情報及び前記対応辞書に基づいて、前記特定の作業の開示時刻から終了時刻までの期間に受入れられた前記音声から変換された文字列の重要度を判定する重要度判定部と、
    前記期間に受入れられた前記音声から変換された文字列を、前記重要度に応じて区別して出力する出力部と、
    を有する音声記録選択装置。
  2. 利用者の加速度及び前記利用者の位置の少なくともいずれかを検知する検知部をさらに有し、
    前記記憶部は、
    前記利用者の加速度により特定される動作の組合せ及び前記利用者の位置の少なくともいずれかと、前記特定の作業との対応を示す対応モデルをさらに記憶し、
    前記作業認識部は、
    前記検知部が検知した前記利用者の加速度により特定された動作の組合せ及び前記検知部が検知した前記利用者の位置の少なくともいずれか並びに前記対応モデルに応じて前記作業情報を認識する
    請求項1に記載の音声記録選択装置。
  3. 前記出力部は、
    前記作業情報に応じて前記期間を表示する出力、及び前記期間に前記音声受入部が受入れた音声から変換された文字列を前記重要度に応じて区別して表示する出力を行い、
    前記出力部が表示した前記期間を特定する入力を受入れる操作受入部と、
    前記音声受入部が受入れた音声を記録する音声記録部と、
    音声を出力する音声出力部と、
    前記操作受入部が受入れた入力により特定された前記期間に前記音声記録部が記録した音声を前記音声出力部が出力するよう制御する制御部と、
    をさらに有する
    請求項2に記載の音声記録選択装置。
  4. 前記検知部は、
    前記利用者の脈拍及び前記利用者が位置する環境の温度の少なくともいずれかをさらに検知し、
    前記対応モデルは、
    前記検知部が検知する前記利用者の脈拍及び前記利用者が位置する環境の温度の少なくともいずれかと、前記特定の作業との対応を示す情報をさらに含み、
    前記作業認識部は、
    前記検知部が検知した前記利用者の加速度により特定された動作の組合せ、前記利用者の位置、前記利用者の脈拍及び前記利用者が位置する環境の温度の少なくともいずれか並びに前記対応モデルに応じて前記作業情報を認識する
    請求項2に記載の音声記録選択装置。
  5. 前記操作受入部は、
    前記出力部が表示した前記期間を変更する入力をさらに受入れ、
    前記制御部は、
    前記操作受入部が受入れた前記期間を変更する入力に応じて、前記作業情報を変更するようさらに制御する
    請求項3に記載の音声記録選択装置。
  6. 前記出力部は、
    前記期間内に前記音声記録部が連続する音声を記録した連続音声期間をさらに表示する出力を行い、
    前記操作受入部は、
    前記連続音声期間を特定する入力をさらに受入れ、
    前記制御部は、
    前記操作受入部が受入れた入力により特定された前記連続音声期間に前記音声記録部が記録した音声を前記音声出力部が出力するようさらに制御する
    請求項5に記載の音声記録選択装置。
  7. 音声記録を選択する音声記録選択方法であって、
    特定の作業において重要な文字列及び文字列の属性の少なくともいずれかと、前記特定の作業における前記文字列及び前記属性の重要度と、を前記特定の作業に対応付けた対応辞書を記憶する記憶部を備え、
    音声受入部が受入れた音声を認識して文字列に変換する工程と、
    開始時刻及び終了時刻が定められた特定の作業を示す作業情報を認識する工程と、
    前記作業情報及び前記対応辞書に基づいて、前記特定の作業の開示時刻から終了時刻までの期間に受入れられた前記音声から変換された文字列の重要度を判定する工程と、
    前記期間に受入れられた前記音声から変換された文字列を、前記重要度に応じて区別して出力する工程と、
    を含む音声記録選択方法。
  8. 音声受入部が受入れた音声を認識して文字列に変換するステップと、
    開始時刻及び終了時刻が定められた特定の作業を示す作業情報を認識するステップと、 前記特定の作業において重要な文字列及び文字列の属性の少なくともいずれかと、前記特定の作業における前記文字列及び前記属性の重要度と、を前記特定の作業に対応付けた対応辞書、及び前記作業情報に基づいて、前記特定の作業の開示時刻から終了時刻までの期間に受入れられた前記音声から変換された文字列の重要度を判定するステップと、
    前記期間に受入れられた前記音声から変換された文字列を、前記重要度に応じて区別して出力するステップと、
    をコンピュータに実行させるための音声記録選択プログラム。
JP2012038955A 2012-02-24 2012-02-24 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム Active JP5426706B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012038955A JP5426706B2 (ja) 2012-02-24 2012-02-24 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012038955A JP5426706B2 (ja) 2012-02-24 2012-02-24 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム

Publications (2)

Publication Number Publication Date
JP2013174718A true JP2013174718A (ja) 2013-09-05
JP5426706B2 JP5426706B2 (ja) 2014-02-26

Family

ID=49267674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012038955A Active JP5426706B2 (ja) 2012-02-24 2012-02-24 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム

Country Status (1)

Country Link
JP (1) JP5426706B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016349A (ja) * 2015-06-30 2017-01-19 富士通株式会社 作業管理プログラム、作業管理方法および作業管理システム
JP2017167391A (ja) * 2016-03-17 2017-09-21 三菱重工業株式会社 作業実績記録システム、作業実績記録方法及びプログラム
JP6250852B1 (ja) * 2017-03-16 2017-12-20 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018156627A (ja) * 2017-11-15 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2019099960A (ja) * 2017-12-06 2019-06-24 東芝デジタルソリューションズ株式会社 採寸情報入力支援システム
JP2020030468A (ja) * 2018-08-20 2020-02-27 アイホン株式会社 看護業務支援システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007111162A1 (ja) * 2006-03-24 2007-10-04 Nec Corporation テキスト表示装置、テキスト表示方法およびプログラム
JP2010256391A (ja) * 2009-04-21 2010-11-11 Takeshi Hanamura 音声情報処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007111162A1 (ja) * 2006-03-24 2007-10-04 Nec Corporation テキスト表示装置、テキスト表示方法およびプログラム
JP2010256391A (ja) * 2009-04-21 2010-11-11 Takeshi Hanamura 音声情報処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016349A (ja) * 2015-06-30 2017-01-19 富士通株式会社 作業管理プログラム、作業管理方法および作業管理システム
JP2017167391A (ja) * 2016-03-17 2017-09-21 三菱重工業株式会社 作業実績記録システム、作業実績記録方法及びプログラム
JP6250852B1 (ja) * 2017-03-16 2017-12-20 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018155882A (ja) * 2017-03-16 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2018156627A (ja) * 2017-11-15 2018-10-04 ヤフー株式会社 判定プログラム、判定装置及び判定方法
JP2019099960A (ja) * 2017-12-06 2019-06-24 東芝デジタルソリューションズ株式会社 採寸情報入力支援システム
JP7154754B2 (ja) 2017-12-06 2022-10-18 東芝デジタルソリューションズ株式会社 採寸情報入力支援システム
JP2020030468A (ja) * 2018-08-20 2020-02-27 アイホン株式会社 看護業務支援システム

Also Published As

Publication number Publication date
JP5426706B2 (ja) 2014-02-26

Similar Documents

Publication Publication Date Title
JP5426706B2 (ja) 音声記録選択装置、音声記録選択方法及び音声記録選択プログラム
KR102389625B1 (ko) 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법
CN113744733B (zh) 数字助理的语音触发器
KR20180060328A (ko) 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버
CN103959751A (zh) 自动调整用户界面以用于免提交互
EP3738117B1 (en) System for processing user utterance and controlling method thereof
WO2020244416A1 (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
KR102343084B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
WO2020244355A1 (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110248019A (zh) 用于启用语音的对话界面的方法、计算机存储介质和设备
WO2020244402A1 (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN112840396A (zh) 用于处理用户话语的电子装置及其控制方法
CN109460752A (zh) 一种情绪分析方法、装置、电子设备及存储介质
WO2020244411A1 (zh) 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110992927B (zh) 音频生成方法、装置、计算机可读存储介质及计算设备
CN105580071A (zh) 用于训练声音识别模型数据库的方法和装置
JP2018025855A (ja) 情報処理サーバ、情報処理装置、情報処理システム、情報処理方法、およびプログラム
WO2016183961A1 (zh) 智能设备的界面切换方法、系统、设备及非易失性计算机存储介质
CN106874057B (zh) 一种信息录入方法及其设备
CN112513984A (zh) 电子设备及其控制方法
JP6125445B2 (ja) ライフログ記録システム及びそのプログラム
CN110830368A (zh) 即时通讯消息发送方法及电子设备
WO2016206646A1 (zh) 使机器装置产生动作的方法及系统
JP5988077B2 (ja) 発話区間検出装置及び発話区間検出のためのコンピュータプログラム
EP4310636A1 (en) Gesture interaction method, system, and apparatus

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130820

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131128

R151 Written notification of patent or utility model registration

Ref document number: 5426706

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350