JP7229821B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP7229821B2 JP7229821B2 JP2019049064A JP2019049064A JP7229821B2 JP 7229821 B2 JP7229821 B2 JP 7229821B2 JP 2019049064 A JP2019049064 A JP 2019049064A JP 2019049064 A JP2019049064 A JP 2019049064A JP 7229821 B2 JP7229821 B2 JP 7229821B2
- Authority
- JP
- Japan
- Prior art keywords
- anonymization
- sentence
- processing
- document data
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 28
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000012545 processing Methods 0.000 claims description 178
- 238000000034 method Methods 0.000 claims description 64
- 230000000873 masking effect Effects 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 23
- 238000013500 data storage Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09C—CIPHERING OR DECIPHERING APPARATUS FOR CRYPTOGRAPHIC OR OTHER PURPOSES INVOLVING THE NEED FOR SECRECY
- G09C1/00—Apparatus or methods whereby a given sequence of signs, e.g. an intelligible text, is transformed into an unintelligible sequence of signs by transposing the signs or groups of signs or by replacing them by others according to a predetermined system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2113—Multi-level security, e.g. mandatory access control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Document Processing Apparatus (AREA)
- Storage Device Security (AREA)
Description
また、秘匿化の対象でないと判定されたセンテンスについては、当該センテンスに含まれるワードごとに、あらかじめ設定された第2のルールに基づいて、当該ワードが秘匿化の対象であるか否かを判定し、秘匿化の対象であると判定されたワード単位で秘匿化処理が実行される。これにより、秘匿対象でないセンテンスについても、秘匿対象のワードを含む場合にはそのワード単位で適切に秘匿化された、開示用の文書データを得ることができる。
(構成)
(1)システム
図1は、この発明の一実施形態に係る情報処理装置としての文書処理装置1を備えたシステムの全体構成の一例を示す図である。
(2-1)ハードウェア構成
図2は、この発明の一実施形態に係る文書処理装置1のハードウェア構成の一例を示すブロック図である。
図3は、この発明の一実施形態に係る文書処理装置1のソフトウェア構成を、図2に示したハードウェア構成と関連付けて示したブロック図である。
データメモリ30の記憶領域には、秘匿化ルール記憶部31と、文書データ記憶部32とが設けられている。
次に、以上のように構成された情報処理装置としての文書処理装置1による情報処理動作を説明する。図4はその処理手順と処理内容を示すフローチャートである。
以上詳述したように、この発明の一実施形態では、文書データDDを処理する文書処理装置1において、文字情報からなるセンテンスを含む文書データDDを取得する文書データ取得部22と、文書データDDをセンテンスに分割するセンテンス分割部23と、文書データDDに含まれる分割されたセンテンスごとに、あらかじめ設定された秘匿化ルールに基づいて、当該センテンスが秘匿化の対象であるか否かを判定する秘匿対象判定部24と、秘匿化の対象であると判定された場合に、当該センテンスに対して秘匿化処理を実行する秘匿化処理部25と、秘匿化処理部25によって秘匿化処理を実行されたセンテンスを含む処理済み文書データMDを出力する出力部とを具備するようにした。さらに、秘匿対象判定部24により、秘匿化の対象でないと判定されたセンテンスについてもワード単位で秘匿化の対象であるか否かの判定を行い、秘匿化の対象であるワードについては、秘匿化処理部25によってワード単位で適切な秘匿化処理が実行されるようにした。
なお、この発明は上記実施形態に限定されるものではない。
例えば、文書処理装置1は、音声情報処理装置2の機能を備えるものであってもよい。あるいは、文書処理装置1が備える各機能部を、複数の装置に分散配置し、これらの装置が互いに連携することにより処理を行うようにしてもよい。
2…音声情報処理装置
3…入力デバイス
4…表示デバイス
11…通信インタフェース
12…入出力インタフェース
20…制御ユニット
20A…ハードウェアプロセッサ
20B…プログラムメモリ
21…秘匿化ルール取得部
22…文書データ取得部
23…センテンス分割部
24…秘匿対象判定部
25…秘匿化処理部
26…出力制御部
30…データメモリ
31…秘匿化ルール記憶部
32…文書データ記憶部
50…バス
Claims (9)
- 文字情報からなるセンテンスを含む第1の文書データを取得する文書データ取得部と、
前記第1の文書データをセンテンスに分割するセンテンス分割部と、
前記第1の文書データに含まれる分割されたセンテンスごとに、あらかじめ設定された第1のルールに基づいて、当該センテンスが秘匿化の対象であるか否かを判定し、秘匿化の対象でないと判定されたセンテンスについて、当該センテンスに含まれるワードごとに、あらかじめ設定された第2のルールに基づいて、当該ワードが秘匿化の対象であるか否かを判定する秘匿対象判定部と、
秘匿化の対象であると判定された場合に、当該センテンスに対して、当該センテンス中の文字をすべて特定の記号に置き換えるマスク処理、当該センテンス全体の暗号化処理、または当該センテンスの削除、のうちの何れかを含む秘匿化処理を実行し、秘匿化の対象でないと判定されたセンテンスについては秘匿化の対象であると判定されたワード単位で秘匿化処理を実行する秘匿化処理部と、
前記秘匿化処理部によって秘匿化処理を実行されたセンテンスを含む第2の文書データを出力する出力部と
を具備する情報処理装置。 - 前記秘匿対象判定部は、特定のセンテンス中に秘匿化の対象語が一定数または一定割合以上含まれる場合に、当該センテンスが秘匿化の対象であると判定する、請求項1に記載の情報処理装置。
- 前記秘匿対象判定部は、特定のセンテンスが特定の話者に関連付けられる場合に、当該センテンスが秘匿化の対象であると判定する、請求項1に記載の情報処理装置。
- 前記秘匿対象判定部は、特定のセンテンス中に秘匿化を要することを示す語句が含まれる場合に、前記特定のセンテンスと同一の話者の発話として識別される、前記特定のセンテンスに連続する一連のセンテンスを秘匿化の対象であると判定する、請求項1に記載の情報処理装置。
- 前記秘匿対象判定部は、前記あらかじめ設定されたルールに基づいて、前記第1の文書データに含まれる分割されたセンテンスごとに機密性の高さを表す機密レベルを判定し、
前記秘匿化処理部は、前記センテンスごとに、前記秘匿対象判定部によって判定された機密レベルに応じて異なる秘匿化処理を実行する、請求項1に記載の情報処理装置。 - 前記秘匿化処理部は、前記センテンスごとに、前記機密レベルに応じて異なる鍵を用いて元のセンテンスへと復元可能な秘匿化処理を実行する、請求項5に記載の情報処理装置。
- 前記秘匿化処理部は、秘匿化の対象であると判定されたセンテンスに対して時限式の秘匿化処理を実行する、請求項1に記載の情報処理装置。
- 情報処理装置が実行する情報処理方法であって、
文字情報からなるセンテンスを含む第1の文書データを取得する過程と、
前記第1の文書データをセンテンスに分割する過程と、
前記第1の文書データに含まれる分割されたセンテンスごとに、あらかじめ設定されたルールに基づいて、当該センテンスが秘匿化の対象であるか否かを判定、秘匿化の対象でないと判定されたセンテンスについて、当該センテンスに含まれるワードごとに、あらかじめ設定された第2のルールに基づいて、当該ワードが秘匿化の対象であるか否かを判定する過程と、
秘匿化の対象であると判定された場合に、当該センテンスに対して、当該センテンス中の文字をすべて特定の記号に置き換えるマスク処理、当該センテンス全体の暗号化処理、または当該センテンスの削除、のうちの何れかを含む秘匿化処理を実行し、秘匿化の対象でないと判定されたセンテンスについては秘匿化の対象であると判定されたワード単位で秘匿化処理を実行する過程と、
前記秘匿化処理を実行する過程によって秘匿化処理を実行されたセンテンスを含む第2の文書データを出力する過程と
を具備する情報処理方法。 - 請求項1乃至請求項7の何れかに記載の装置による各処理をハードウェアプロセッサに実行させるプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019049064A JP7229821B2 (ja) | 2019-03-15 | 2019-03-15 | 情報処理装置、情報処理方法およびプログラム |
CN202080005003.8A CN112654991A (zh) | 2019-03-15 | 2020-03-11 | 信息处理装置、信息处理方法及程序 |
PCT/JP2020/010529 WO2020189441A1 (ja) | 2019-03-15 | 2020-03-11 | 情報処理装置、情報処理方法およびプログラム |
US17/275,870 US20220058277A1 (en) | 2019-03-15 | 2020-03-11 | Information processing apparatus, information processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019049064A JP7229821B2 (ja) | 2019-03-15 | 2019-03-15 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020149628A JP2020149628A (ja) | 2020-09-17 |
JP7229821B2 true JP7229821B2 (ja) | 2023-02-28 |
Family
ID=72430648
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019049064A Active JP7229821B2 (ja) | 2019-03-15 | 2019-03-15 | 情報処理装置、情報処理方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220058277A1 (ja) |
JP (1) | JP7229821B2 (ja) |
CN (1) | CN112654991A (ja) |
WO (1) | WO2020189441A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6986589B2 (ja) * | 2020-03-31 | 2021-12-22 | ソフトバンク株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
WO2022215120A1 (ja) * | 2021-04-05 | 2022-10-13 | 株式会社KPMG Ignition Tokyo | 情報処理装置、情報処理方法、情報処理プログラム |
WO2023013062A1 (ja) * | 2021-08-06 | 2023-02-09 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法、及び記録媒体 |
US11954213B2 (en) * | 2021-09-13 | 2024-04-09 | International Business Machines Corporation | Obfuscating intelligent data while preserving reserve values |
WO2023074008A1 (ja) * | 2021-10-28 | 2023-05-04 | 日本電気株式会社 | 文書マスキング装置、文書マスキング方法およびプログラム記憶媒体 |
CN114741717B (zh) * | 2022-06-14 | 2022-09-06 | 合肥高维数据技术有限公司 | 基于ooxml文档的隐藏信息嵌入和提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001189718A (ja) | 1999-12-28 | 2001-07-10 | Eiichi Masai | 期日指定文書の作製方法及びその作製装置、並びに期日指定文書の作製プログラムを記録した記録媒体 |
JP2004213376A (ja) | 2002-12-27 | 2004-07-29 | Canon Sales Co Inc | マスキング装置及びその制御方法、プログラム |
JP2008193612A (ja) | 2007-02-07 | 2008-08-21 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
JP2014186425A (ja) | 2013-03-22 | 2014-10-02 | Mitsubishi Denki Information Technology Corp | 文章マスク装置及び文章マスクプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5991709A (en) * | 1994-07-08 | 1999-11-23 | Schoen; Neil Charles | Document automated classification/declassification system |
US8176563B2 (en) * | 2000-11-13 | 2012-05-08 | DigitalDoors, Inc. | Data security system and method with editor |
US7433869B2 (en) * | 2005-07-01 | 2008-10-07 | Ebrary, Inc. | Method and apparatus for document clustering and document sketching |
US9596349B1 (en) * | 2015-06-29 | 2017-03-14 | State Farm Mutual Automobile Insurance Company | Voice and speech recognition for call center feedback and quality assurance |
CN106504744B (zh) * | 2016-10-26 | 2020-05-01 | 科大讯飞股份有限公司 | 一种语音处理方法及装置 |
KR102424520B1 (ko) * | 2017-11-29 | 2022-07-25 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 동작 방법 |
CN112970061A (zh) * | 2018-11-14 | 2021-06-15 | 惠普发展公司,有限责任合伙企业 | 基于策略许可的内容 |
-
2019
- 2019-03-15 JP JP2019049064A patent/JP7229821B2/ja active Active
-
2020
- 2020-03-11 CN CN202080005003.8A patent/CN112654991A/zh active Pending
- 2020-03-11 WO PCT/JP2020/010529 patent/WO2020189441A1/ja active Application Filing
- 2020-03-11 US US17/275,870 patent/US20220058277A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001189718A (ja) | 1999-12-28 | 2001-07-10 | Eiichi Masai | 期日指定文書の作製方法及びその作製装置、並びに期日指定文書の作製プログラムを記録した記録媒体 |
JP2004213376A (ja) | 2002-12-27 | 2004-07-29 | Canon Sales Co Inc | マスキング装置及びその制御方法、プログラム |
JP2008193612A (ja) | 2007-02-07 | 2008-08-21 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
JP2014186425A (ja) | 2013-03-22 | 2014-10-02 | Mitsubishi Denki Information Technology Corp | 文章マスク装置及び文章マスクプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020149628A (ja) | 2020-09-17 |
CN112654991A (zh) | 2021-04-13 |
WO2020189441A1 (ja) | 2020-09-24 |
US20220058277A1 (en) | 2022-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7229821B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US10552118B2 (en) | Context based identification of non-relevant verbal communications | |
US9652113B1 (en) | Managing multiple overlapped or missed meetings | |
TWI536365B (zh) | 聲紋辨識 | |
CN112272828A (zh) | 模糊与个人可识别信息(pii)有关的信息 | |
EP2157571A2 (en) | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method | |
Ellis et al. | The end of symbiosis? Australia police–media relations in the digital age | |
US20070133437A1 (en) | System and methods for enabling applications of who-is-speaking (WIS) signals | |
KR102212298B1 (ko) | 인공지능 기반의 비장애인과 청각장애인 간 화상 커뮤니케이션 플랫폼 시스템 및 그 동작 방법 | |
JP6795668B1 (ja) | 議事録作成システム | |
JP2008310618A (ja) | Web会議支援プログラム、該プログラムを記録した記録媒体、Web会議支援装置、およびWeb会議支援方法 | |
JPH08316953A (ja) | 電子会議システム | |
US20230033595A1 (en) | Automated actions in a conferencing service | |
Saptorini et al. | Place, power and the pandemic: The disrupted material settings of television news making during COVID-19 in an Indonesian broadcaster | |
Källstig | Laughing in the face of danger: Performativity and resistance in Zimbabwean stand-up comedy | |
JP2008011272A (ja) | 会議システム及び制御方法、並びにプログラム及び記憶媒体 | |
EP3040915A1 (en) | Method and apparatus for identifying trends | |
JP2019145944A (ja) | 音響出力システム、音響出力方法及びプログラム | |
JP7344612B1 (ja) | プログラム、会話要約装置、および会話要約方法 | |
JP2021120813A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2005025571A (ja) | 業務支援装置、業務支援方法およびそのプログラム | |
Chen | Research on the Trends of Work Collaboration Industry Under Covid-19 | |
Risam | Micro-disclosures for Macro-erasures:# MeToo in the Academy | |
Call | D4. 1 OVERVIEW AND ANALYSIS OF LAWFULLY INTERCEPTED AND PUBLICLY AVAILABLE DATA | |
US20230326454A1 (en) | Dynamic chapter generation for a communication session |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210628 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220930 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20230113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7229821 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |