JP2020126144A - システム、サーバ装置及びプログラム - Google Patents
システム、サーバ装置及びプログラム Download PDFInfo
- Publication number
- JP2020126144A JP2020126144A JP2019018694A JP2019018694A JP2020126144A JP 2020126144 A JP2020126144 A JP 2020126144A JP 2019018694 A JP2019018694 A JP 2019018694A JP 2019018694 A JP2019018694 A JP 2019018694A JP 2020126144 A JP2020126144 A JP 2020126144A
- Authority
- JP
- Japan
- Prior art keywords
- sign language
- unit
- time range
- word
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000003860 storage Methods 0.000 claims description 55
- 230000033001 locomotion Effects 0.000 claims description 54
- 238000000605 extraction Methods 0.000 claims description 36
- 238000012937 correction Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 208000037805 labour Diseases 0.000 abstract 2
- 230000006854 communication Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 18
- 238000012706 support-vector machine Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000003825 pressing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000005520 cutting process Methods 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
[先行技術文献]
[非特許文献]
[非特許文献1]H.Lausberg and H.Sloetjes: Coding gestural behavior with the NEUROGES-ELAN system, Behavior Research Methods, Vol.41, No.3, pp.841-849 (2009)
[非特許文献2]M.Kipp:Multimedia Information Extraction: Advances in Video, Audio, and Imagery Analysis for Search, Data Mining, Surveillance, and Authorig, chapter 21, pp.351-368, John Wiley & Sons Inc. (2014)
20 ネットワーク
100 サーバ装置
102 動画受信部
104 動画格納部
110 UI提供部
112 モデル格納部
120 時間範囲特定部
121 分類部
122 身体動作追跡部
123 手話特徴抽出部
124 分類処理部
125 分類結果補正部
130 手話単語認識部
131 身体動作追跡部
132 手話特徴抽出部
133 モデル生成部
134 認識実行部
140 提示部
142 受付部
144 単語格納部
146 モデル更新部
200 クライアント装置
202 動画取得部
204 表示制御部
206 入力受付部
208 通信部
250 作業者
310 手話動画
311 静止区間
312 動作区間
313 静止区間
400 支援UI
402 動画領域
404 参照ボタン
406 動画開始ボタン
408 動画終了ボタン
410 アイテムボタン
412 送信ボタン
420 入力エリア
422 アイテム
424 アイテム
426 アイテム
510 座標点
520 座標点
530 座標点
600 SVMモデル
602 分割超平面
604 距離
611 フレーム
621 フレーム
630 グラフ
1200 コンピュータ
1210 ホストコントローラ
1212 CPU
1214 RAM
1216 グラフィックコントローラ
1218 ディスプレイデバイス
1220 入出力コントローラ
1222 通信インタフェース
1224 記憶装置
1226 DVDドライブ
1227 DVD−ROM
1230 ROM
1240 入出力チップ
Claims (14)
- 手話を行っている人物を含む手話動画を取得する動画取得部と、
前記手話動画を送信する動画送信部と
を有するクライアント装置と、
前記動画送信部によって送信された前記手話動画を受信する動画受信部と、
前記手話動画に対して、前記手話動画において行われている手話によって表される単語を対応付けるアノテーション作業を支援する支援UI(User Interface)を前記クライアント装置に提供するUI提供部と
を有するサーバ装置と
を備えるシステム。 - 前記UI提供部は、Webブラウザ上で動作する前記支援UIを前記クライアント装置に提供する、請求項1に記載のシステム。
- 前記UI提供部は、
前記手話動画における手話動作が行われている時間範囲を特定する時間範囲特定部と、
予め格納している手話単語認識モデルを用いて、前記時間範囲において行われている手話動作によって表わされる単語を認識する手話単語認識部と、
前記時間範囲特定部によって特定された前記時間範囲と、前記手話単語認識部によって認識された単語とを前記支援UIを介して提示する提示部と
を含む、請求項1又は2に記載のシステム。 - 前記提示部は、前記支援UIを介して、前記時間範囲及び前記単語を修正可能に提示し、
前記UI提供部は、
前記時間範囲及び前記単語に対する修正を受け付ける修正受付部と、
修正後の前記時間範囲及び前記単語を対応付けて格納する単語格納部と
を含む、請求項3に記載のシステム。 - 前記単語格納部に格納されている前記時間範囲及び前記単語に基づいて、前記手話単語認識モデルを更新するモデル更新部
を備える、請求項4に記載のシステム。 - 前記手話単語認識部は、
前記手話動画の前記時間範囲の複数のフレームのそれぞれについて、前記人物の身体の各部位の座標点を取得する身体動作追跡部と、
前記身体動作追跡部による取得結果に基づいて、手話の特徴を示す手話特徴データを導出する手話特徴抽出部と、
前記手話特徴抽出部が導出した複数の前記手話特徴データを用いて前記手話単語認識モデルを生成するモデル生成部と
を含む、請求項3から5のいずれか一項に記載のシステム。 - 前記身体動作追跡部は、前記手話動画の前記時間範囲の複数のフレームのそれぞれについて、前記人物の身体の各部の座標点と、前記座標点の信頼度とを取得し、
前記手話特徴抽出部は、前記身体動作追跡部によって取得された複数の座標点のうち、信頼度が予め定められた閾値以下である座標点を、当該座標点に対応する座標点の信頼度が前記閾値より高い、当該座標点を含むフレームよりも過去のフレームであって、当該座標点を含むフレームに最も時間が近いフレームに含まれる当該座標点に対応する座標点によって補正する、請求項6に記載のシステム。 - 前記手話特徴抽出部は、前記身体動作追跡部によって取得された複数のフレームのそれぞれの複数の座標点に対して、予め定められた原点及び予め定められた基準長を用いて座標変換を施す、請求項6又は7に記載のシステム。
- 前記手話特徴抽出部は、前記人物の身体、左手、右手、及び顔毎に、予め定められた原点及び基準長を用いて座標変換を施す、請求項8に記載のシステム。
- 前記UI提供部は、
前記手話動画において手話動作が行われている時間範囲を特定する時間範囲特定部と、
前記支援UIを介して、前記時間範囲に対応付ける単語の入力を受け付ける入力受付部と、
前記時間範囲と前記単語とを対応付けて格納する単語格納部と
を含む、請求項1又は2に記載のシステム。 - 前記時間範囲特定部は、
学習用の手話動画に含まれる複数のフレームのそれぞれの、フレーム内の人物が静止状態であるか動作状態であるかを示す状態情報及び手話の特徴を示す手話特徴データを用いてSVM(Support Vector Machine)モデルを学習することによって導出された分割超平面に基づいて、前記動画受信部が受信した前記手話動画に含まれる複数のフレームを、静止状態と動作状態とに分類する分類部と、
時系列データの特徴量と隣接データ間の特徴量連続性とに基づく分割手法を用いて、前記分類部による分類結果を補正する分類結果補正部と
を含む、請求項10に記載のシステム。 - 前記分類部は、
前記動画受信部が受信した前記手話動画に含まれる複数のフレームのそれぞれについて、前記人物の身体の各部位の座標点を取得する身体動作追跡部と、
前記身体動作追跡部による取得結果に基づいて、前記複数のフレームのそれぞれについて、手話の特徴を示す手話特徴データを導出する手話特徴抽出部と、
前記複数のフレームのそれぞれの前記手話特徴データと前記分割超平面とに基づいて、前記複数のフレームを静止状態と動作状態とに分類する分類処理部と
を含み、
前記分類結果補正部は、前記複数のフレームのそれぞれの前記手話特徴データの前記分割超平面からの距離と、前記分類処理部による分類結果とをGraphcutsに適用することにより、前記分類結果を補正する、請求項11に記載のシステム。 - 手話を行っている人物を含む手話動画をクライアント装置から受信する動画受信部と、
前記手話動画に対して、前記手話動画において行われている手話によって表される単語を対応付けるアノテーション作業を支援する支援UIを前記クライアント装置に提供するUI提供部と
を備えるサーバ装置。 - コンピュータを、請求項13に記載のサーバ装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019018694A JP6840365B2 (ja) | 2019-02-05 | 2019-02-05 | システム、サーバ装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019018694A JP6840365B2 (ja) | 2019-02-05 | 2019-02-05 | システム、サーバ装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020126144A true JP2020126144A (ja) | 2020-08-20 |
JP6840365B2 JP6840365B2 (ja) | 2021-03-10 |
Family
ID=72083908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019018694A Active JP6840365B2 (ja) | 2019-02-05 | 2019-02-05 | システム、サーバ装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6840365B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022091304A1 (en) * | 2020-10-29 | 2022-05-05 | Nec Corporation | Categorization apparatus, control device, categorization method, control method and computer readable medium |
JP7485454B2 (ja) | 2022-08-05 | 2024-05-16 | Necソリューションイノベータ株式会社 | 手話翻訳処理装置、手話翻訳処理システム、手話翻訳処理方法、プログラム、及び記録媒体 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337628A (ja) * | 1993-05-31 | 1994-12-06 | Hitachi Ltd | 手話翻訳確認装置 |
JP2008292963A (ja) * | 2007-05-23 | 2008-12-04 | Saori Tanaka | 手話学習装置 |
JP2015148706A (ja) * | 2014-02-06 | 2015-08-20 | 日本放送協会 | 手話単語分類情報生成装置およびそのプログラム、ならびに、手話単語検索装置およびそのプログラム |
JP2017084335A (ja) * | 2015-08-31 | 2017-05-18 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | ユーザーインターフェースのリアルタイムインタラクティブ操作のためのシステム及び方法 |
JP2017191576A (ja) * | 2016-04-15 | 2017-10-19 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
JP2017204067A (ja) * | 2016-05-10 | 2017-11-16 | 株式会社オルツ | 手話会話支援システム |
-
2019
- 2019-02-05 JP JP2019018694A patent/JP6840365B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337628A (ja) * | 1993-05-31 | 1994-12-06 | Hitachi Ltd | 手話翻訳確認装置 |
JP2008292963A (ja) * | 2007-05-23 | 2008-12-04 | Saori Tanaka | 手話学習装置 |
JP2015148706A (ja) * | 2014-02-06 | 2015-08-20 | 日本放送協会 | 手話単語分類情報生成装置およびそのプログラム、ならびに、手話単語検索装置およびそのプログラム |
JP2017084335A (ja) * | 2015-08-31 | 2017-05-18 | コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド | ユーザーインターフェースのリアルタイムインタラクティブ操作のためのシステム及び方法 |
JP2017191576A (ja) * | 2016-04-15 | 2017-10-19 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法およびプログラム |
JP2017204067A (ja) * | 2016-05-10 | 2017-11-16 | 株式会社オルツ | 手話会話支援システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022091304A1 (en) * | 2020-10-29 | 2022-05-05 | Nec Corporation | Categorization apparatus, control device, categorization method, control method and computer readable medium |
JP7485217B2 (ja) | 2020-10-29 | 2024-05-16 | 日本電気株式会社 | 分類装置、分類方法及びプログラム |
JP7485454B2 (ja) | 2022-08-05 | 2024-05-16 | Necソリューションイノベータ株式会社 | 手話翻訳処理装置、手話翻訳処理システム、手話翻訳処理方法、プログラム、及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6840365B2 (ja) | 2021-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11062090B2 (en) | Method and apparatus for mining general text content, server, and storage medium | |
CN107832662B (zh) | 一种获取图片标注数据的方法和系统 | |
CN109635838B (zh) | 人脸样本图片标注方法、装置、计算机设备及存储介质 | |
WO2019233421A1 (zh) | 图像处理方法及装置、电子设备、存储介质 | |
US8649602B2 (en) | Systems and methods for tagging photos | |
US20190251471A1 (en) | Machine learning device | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
EP2461273A2 (en) | Method and system for machine-learning based optimization and customization of document similarities calculation | |
CN113382279B (zh) | 直播推荐方法、装置、设备、存储介质以及计算机程序产品 | |
EP3872652B1 (en) | Method and apparatus for processing video, electronic device, medium and product | |
US20180239986A1 (en) | Image Clustering Method, Image Clustering System, And Image Clustering Server | |
US20170185913A1 (en) | System and method for comparing training data with test data | |
CN110941978B (zh) | 一种未识别身份人员的人脸聚类方法、装置及存储介质 | |
CN113780098B (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
CN113205047B (zh) | 药名识别方法、装置、计算机设备和存储介质 | |
CN113221918B (zh) | 目标检测方法、目标检测模型的训练方法及装置 | |
US11823494B2 (en) | Human behavior recognition method, device, and storage medium | |
JP6840365B2 (ja) | システム、サーバ装置及びプログラム | |
US20150139547A1 (en) | Feature calculation device and method and computer program product | |
CN113255501B (zh) | 生成表格识别模型的方法、设备、介质及程序产品 | |
CN111292333A (zh) | 用于分割图像的方法和装置 | |
US20210374147A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2017538226A (ja) | スケーラブルなウェブデータの抽出 | |
CN111552780B (zh) | 医用场景的搜索处理方法、装置、存储介质及电子设备 | |
US11227186B2 (en) | Method and device for training image recognition model and related device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20190307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200508 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200508 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200914 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200918 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6840365 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |