JP2010092352A - 顔文字検出装置、その方法、プログラム及び記録媒体 - Google Patents
顔文字検出装置、その方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2010092352A JP2010092352A JP2008262871A JP2008262871A JP2010092352A JP 2010092352 A JP2010092352 A JP 2010092352A JP 2008262871 A JP2008262871 A JP 2008262871A JP 2008262871 A JP2008262871 A JP 2008262871A JP 2010092352 A JP2010092352 A JP 2010092352A
- Authority
- JP
- Japan
- Prior art keywords
- character
- text
- face part
- emoticon
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】顔部分抽出部12により、顔部分辞書記憶部11に記憶された、顔文字を構成する文字列中の顔部分の文字列を登録してなる顔部分辞書を用いてテキスト中の顔部分の文字列に対応する範囲を抽出し、この範囲に基づき、顔部分情報生成部13により、文字分割部3で文字単位に分割された前記テキスト中の各文字が顔部分であるか否かを示す顔部分情報を生成し、これを当該テキスト中の各文字の表記とともに素性として用いて、BIO判定部15により、モデル記憶部14に記憶されたモデルを用いて、顔文字を構成する最初の文字“B”、顔文字を構成する2番目以降の文字“I”、顔文字以外の文字“O”のいずれに当たるかを機械学習で判定する。
【選択図】図6
Description
田中裕紀、高村大也、奥村学、「文字ベースのコミュニケーションにおける顔文字に関する研究」、言語処理学会第10回年次大会、D4−3、2004
Claims (7)
- テキスト中の顔文字を検出する装置であって、
顔文字を構成する文字列中の顔部分の文字列を登録してなる顔部分辞書を記憶する顔部分辞書記憶部と、
テキストから前記顔部分辞書記憶部に記憶された顔部分辞書に登録されている顔部分の文字列に対応する範囲を抽出する顔部分抽出部と、
前記テキストを文字単位に分割する文字分割部と、
文字単位に分割された前記テキスト中の各文字が顔部分であるか否かを示す顔部分情報を、抽出された前記テキストにおける顔部分の範囲に基づいて生成する顔部分情報生成部と、
少なくともテキスト中の各文字の表記およびその顔部分情報を素性として、当該テキスト中の各文字が顔文字を構成する文字列の最初の文字を意味する“B”、顔文字を構成する文字列の2番目以降の文字を意味する“I”、顔文字以外の文字を意味する“O”のいずれに当たるかを判定するためのモデルを記憶するモデル記憶部と、
文字単位に分割された前記テキスト中の各文字の表記およびその顔部分情報を入力とし、前記モデル記憶部に記憶されたモデルを用いて、前記テキスト中の各文字が前記“B”、“I”、“O”のいずれに当たるかを判定するBIO判定部とを備えた
ことを特徴とする顔文字検出装置。 - 顔部分情報生成は、
文字単位に分割された前記テキスト中の各文字の位置と、抽出された前記テキストにおける顔部分の範囲の文字位置とを比較し、一致する場合は顔部分であることを示す顔部分情報を、一致しない場合は顔部分でないことを示す顔部分情報を、当該テキスト中の各文字の表記に対応させて出力することで行う
ことを特徴とする請求項1に記載の顔文字検出装置。 - テキスト中の顔文字を検出する方法であって、
顔部分抽出部が、テキストから顔部分辞書に登録されている顔文字を構成する文字列中の顔部分の文字列に対応する範囲を抽出するステップと、
文字分割部が、前記テキストを文字単位に分割するステップと、
顔部分情報生成部が、文字単位に分割された前記テキスト中の各文字が顔部分であるか否かを示す顔部分情報を、抽出された前記テキストにおける顔部分の範囲に基づいて生成するステップと、
BIO判定部が、文字単位に分割された前記テキスト中の各文字の表記およびその顔部分情報を入力とし、少なくともテキスト中の各文字の表記およびその顔部分情報を素性として、当該テキスト中の各文字が顔文字を構成する文字列の最初の文字を意味する“B”、顔文字を構成する文字列の2番目以降の文字を意味する“I”、顔文字以外の文字を意味する“O”のいずれに当たるかを判定するためのモデルを用いて、前記テキスト中の各文字が前記“B”、“I”、“O”のいずれに当たるかを判定するステップとを含む
ことを特徴とする顔文字検出方法。 - 顔部分情報生成は、
文字単位に分割された前記テキスト中の各文字の位置と、抽出された前記テキストにおける顔部分の範囲の文字位置とを比較し、一致する場合は顔部分であることを示す顔部分情報を、一致しない場合は顔部分でないことを示す顔部分情報を、当該テキスト中の各文字の表記に対応させて出力することで行う
ことを特徴とする請求項3に記載の顔文字検出方法。 - コンピュータを、請求項1または2に記載の顔文字検出装置の各手段として機能させるためのプログラム。
- コンピュータに、請求項3または4に記載の顔文字検出方法の各処理ステップを実行させるためのプログラム。
- 請求項5または6に記載のプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008262871A JP5026385B2 (ja) | 2008-10-09 | 2008-10-09 | 顔文字検出装置、その方法、プログラム及び記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008262871A JP5026385B2 (ja) | 2008-10-09 | 2008-10-09 | 顔文字検出装置、その方法、プログラム及び記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010092352A true JP2010092352A (ja) | 2010-04-22 |
| JP5026385B2 JP5026385B2 (ja) | 2012-09-12 |
Family
ID=42254985
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008262871A Expired - Fee Related JP5026385B2 (ja) | 2008-10-09 | 2008-10-09 | 顔文字検出装置、その方法、プログラム及び記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5026385B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109684478A (zh) * | 2018-12-18 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
-
2008
- 2008-10-09 JP JP2008262871A patent/JP5026385B2/ja not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109684478A (zh) * | 2018-12-18 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
| US11853704B2 (en) | 2018-12-18 | 2023-12-26 | Tencent Technology (Shenzhen) Company Limited | Classification model training method, classification method, device, and medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5026385B2 (ja) | 2012-09-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102540774B1 (ko) | 서브워드 임베딩 및 스킵서트 기반 문장 임베딩 방법 및 장치 | |
| JP2014145842A (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
| WO2003065245A1 (en) | Translating method, translated sentence outputting method, recording medium, program, and computer device | |
| KR101534413B1 (ko) | 상담 정보를 이용하여 상담 대화를 제공하는 방법 및 장치 | |
| WO2007097208A1 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
| Rajesh | Speech to Indian sign language translator | |
| JP5323652B2 (ja) | 類似語決定方法およびシステム | |
| Singh et al. | An integrated model for text to text, image to text and audio to text linguistic conversion using machine learning approach | |
| JP5026385B2 (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP5031713B2 (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP6055267B2 (ja) | 文字列分割装置、モデルファイル学習装置および文字列分割システム | |
| JP6325789B2 (ja) | 翻訳装置及び翻訳プログラム | |
| JP5013539B2 (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP5071986B2 (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP5026384B2 (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP2010092351A (ja) | 顔文字検出装置、その方法、プログラム及び記録媒体 | |
| JP6650901B2 (ja) | 発話文判定装置、方法、及びプログラム | |
| JP2010102564A (ja) | 感情特定装置、その方法、プログラム及び記録媒体 | |
| KR100487716B1 (ko) | 단어레벨의 통계적 방법을 이용한 번역문 생성 방법 및 그장치 | |
| Bilal | Context Free Grammar (CFG)-based English/Urdu Translation System from Video & Audio to Pakistan Sign Language (PSL) Gestures | |
| JP4941495B2 (ja) | ユーザ辞書作成システム、方法、及び、プログラム | |
| JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム | |
| JP5142395B2 (ja) | 関係情報抽出装置、その方法、プログラム及び記録媒体 | |
| JP2003178087A (ja) | 外国語電子辞書検索装置および方法 | |
| JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101215 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110613 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110614 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110615 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110616 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120619 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120620 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150629 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |