JP2022052695A - Method, system, and computer-readable recording medium for managing text-converted record and memo for voice file together - Google Patents

Method, system, and computer-readable recording medium for managing text-converted record and memo for voice file together Download PDF

Info

Publication number
JP2022052695A
JP2022052695A JP2021021396A JP2021021396A JP2022052695A JP 2022052695 A JP2022052695 A JP 2022052695A JP 2021021396 A JP2021021396 A JP 2021021396A JP 2021021396 A JP2021021396 A JP 2021021396A JP 2022052695 A JP2022052695 A JP 2022052695A
Authority
JP
Japan
Prior art keywords
voice
memo
voice recording
recording
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021021396A
Other languages
Japanese (ja)
Other versions
JP7166373B2 (en
Inventor
ジウン シン
Jieun Shin
ギルファン ファン
Gil Hwan Hwang
イェリム チョン
Ye Lim Jeong
ヒャンナム オ
Hyangnam Oh
デヒョン イム
Dae Hyeon Yim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Z Intermediate Global Corp
Naver Corp
Original Assignee
Line Corp
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Line Corp, Naver Corp filed Critical Line Corp
Publication of JP2022052695A publication Critical patent/JP2022052695A/en
Application granted granted Critical
Publication of JP7166373B2 publication Critical patent/JP7166373B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

To provide a method and system that can conveniently search for voice record and a memo for a voice file by matching and associatively managing text-converted record and memo, and thus improve convenience in service use to a user.SOLUTION: A voice record management method includes the stages of converting a voice into a text to generate voice record; matching and managing a memo generated in recording or reproduction of the voice; and associatively providing the voice record and the memo.SELECTED DRAWING: Figure 4

Description

以下の説明は、音声をテキストに変換した音声記録を管理する技術に関する。 The following description relates to a technique for managing voice recordings in which voice is converted into text.

モバイル音声変換技術の流れとしては、モバイルデバイスで音声を録音し、音声録音が終われば、録音された区間の音声をテキストに変換してディスプレイ上に表示するのが一般的である。 As a flow of mobile voice conversion technology, it is common to record voice with a mobile device, and when the voice recording is completed, convert the voice of the recorded section into text and display it on a display.

このような音声変換技術の一例として、特許文献1(公開日2014年5月23日)には、音声録音およびテキスト変換を実行する技術が開示されている。 As an example of such a voice conversion technique, Patent Document 1 (publication date: May 23, 2014) discloses a technique for performing voice recording and text conversion.

韓国公開特許第10-2014-0062217号公報Korean Publication No. 10-2014-0062217

録音された音声をテキストに変換した記録と録音された音声に関連して作成されたメモとをマッチングして管理する方法とシステムを提供する。 It provides a method and system for matching and managing a recording in which a recorded voice is converted into text and a memo created in connection with the recorded voice.

デュアルビュー(dual view)方式によって音声記録とメモをともに表示する方法とシステムを提供する。 It provides a method and system for displaying both audio recordings and memos by a dual view method.

話者やキーワードなどの多様なフィルタリング基準によって音声記録とメモをグルーピングして提供する方法とシステムを提供する。 It provides a method and system for grouping voice recordings and memos according to various filtering criteria such as speakers and keywords.

コンピュータ装置が実行する音声記録管理方法であって、前記コンピュータ装置は、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記音声記録管理方法は、前記少なくとも1つのプロセッサにより、音声をテキストに変換して音声記録を生成する段階、前記少なくとも1つのプロセッサにより、前記音声の録音中または再生中に作成されたメモを前記音声記録とマッチングして管理する段階、および前記少なくとも1つのプロセッサにより、前記音声記録と前記メモを連係させて提供する段階を含む、音声記録管理方法を提供する。 A voice recording management method performed by a computer device, wherein the computer device includes at least one processor configured to execute a computer-readable instruction contained in a memory, and the voice recording management method is described above. At the stage where the voice is converted into text by at least one processor to generate a voice recording, the memo created during the recording or playback of the voice by the at least one processor is managed by matching with the voice recording. Provided is a voice recording management method including a step and a step of linking and providing the voice recording and the memo by the at least one processor.

一側面によると、前記提供する段階は、デュアルビュー方式によって前記音声記録と前記メモをともに表示する段階を含んでよい。 According to one aspect, the provided step may include displaying both the audio recording and the memo by a dual view scheme.

他の側面によると、前記提供する段階は、タイムスタンプを基準として前記音声記録と前記メモを時間的にマッチングして表示する段階を含んでよい。 According to another aspect, the provided step may include a step of temporally matching and displaying the voice recording and the memo based on the time stamp.

また他の側面によると、前記提供する段階は、前記音声記録の場合は、話者発声区間のテキストごとに、該当の区間の基点を示すタイムスタンプを表示する段階、および前記メモの場合は、メモごとに、メモ作成時点の音声録音時間または音声再生時間を示すタイムスタンプを表示する段階を含んでよい。 According to another aspect, the provided stage is, in the case of the voice recording, a stage of displaying a time stamp indicating the base point of the corresponding section for each text of the speaker vocalization section, and in the case of the memo. Each memo may include a step of displaying a time stamp indicating the audio recording time or audio reproduction time at the time of memo creation.

また他の側面によると、前記提供する段階は、前記音声記録に含まれた話者発声区間のテキストに対し、該当の区間に作成されたメモの有無によってメモタグを表示する段階、および前記メモタグが選択される場合、該当のテキストの発声区間に作成されたメモの全文を表示する段階を含んでよい。 According to another aspect, the provided stage is a stage in which a memo tag is displayed depending on the presence or absence of a memo created in the corresponding section with respect to the text of the speaker utterance section included in the voice recording, and the memo tag is When selected, it may include the step of displaying the full text of the memo created in the vocalization section of the text.

また他の側面によると、前記生成する段階は、クライアントが録音した音声ファイルまたは前記クライアントがアップロードした音声ファイルを受信し、話者発声区間に該当する音声データをテキストに変換する段階を含んでよい。 Further, according to another aspect, the generation step may include a step of receiving a voice file recorded by the client or a voice file uploaded by the client and converting the voice data corresponding to the speaker vocalization section into text. ..

また他の側面によると、前記管理する段階は、前記音声記録のタイムスタンプを基準として前記音声の録音中または再生中に作成されたメモをマッチングして管理してよい。 Further, according to another aspect, in the management step, the memo created during the recording or reproduction of the voice may be matched and managed based on the time stamp of the voice recording.

また他の側面によると、前記管理する段階は、前記音声の話者発声区間に作成されたメモと前記話者発声区間の音声記録をマッチングして管理してよい。 Further, according to another aspect, in the management stage, the memo created in the speaker vocalization section of the voice and the voice recording of the speaker vocalization section may be matched and managed.

また他の側面によると、前記音声記録管理方法は、前記少なくとも1つのプロセッサにより、前記音声の録音中または再生中に少なくとも1つの話者発声区間にブックマークを記録する段階をさらに含み、前記提供する段階は、前記音声記録に含まれたテキストのうち、ブックマークが記録された話者発声区間のテキストに対して編集機能を提供する段階を含んでよい。 According to another aspect, the voice recording management method further includes the step of recording a bookmark in at least one speaker vocalization section by the at least one processor during recording or reproduction of the voice. The step may include a step of providing an editing function for the text of the speaker vocalization section in which the bookmark is recorded among the texts included in the voice recording.

さらに他の側面によると、前記提供する段階は、話者またはキーワードを利用して、前記音声記録と前記メモのうちの少なくとも1つをグルーピングして提供する段階を含んでよい。 According to yet another aspect, the providing step may include the step of grouping and providing at least one of the voice recording and the memo by utilizing the speaker or the keyword.

前記音声記録管理方法をコンピュータに実行させるためのプログラムが記録されている、コンピュータ読み取り可能な記録媒体を提供する。 Provided is a computer-readable recording medium in which a program for causing a computer to execute the voice recording management method is recorded.

コンピュータ装置であって、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、音声をテキストに変換して音声記録を生成する音声記録生成部、前記音声の録音中または再生中に作成されたメモを前記音声記録とマッチングして管理するメモマッチング管理部、および前記音声記録と前記メモを連係させて提供する音声記録提供部を含む、コンピュータ装置を提供する。 A computer device that includes at least one processor configured to execute a computer-readable instruction contained in memory, said at least one processor that converts speech into text to produce a speech recording. A recording generation unit, a memo matching management unit that manages a memo created during recording or playback of the voice by matching with the voice recording, and a voice recording providing unit that links the voice recording and the memo. Provides computer equipment, including.

本発明の実施形態によると、録音された音声をテキストに変換した記録と録音された音声と関連して作成されたメモをマッチングし、デュアルビューによって表示することにより、音声記録とメモを便利に探索することができる。 According to the embodiment of the present invention, the recorded voice converted into text and the memo created in connection with the recorded voice are matched and displayed by the dual view, thereby making the voice recording and the memo convenient. You can explore.

本発明の実施形態によると、音声記録とメモを話者またはキーワード別にグルーピングするフィルタリング機能を提供することにより、サービス利用に対するユーザの利便性を向上させることができる。 According to the embodiment of the present invention, by providing a filtering function for grouping voice recordings and memos by speaker or keyword, it is possible to improve the convenience of the user for using the service.

本発明の一実施形態における、ネットワーク環境の例を示した図である。It is a figure which showed the example of the network environment in one Embodiment of this invention. 本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。It is a block diagram which showed the example of the computer apparatus in one Embodiment of this invention. 本発明の一実施形態における、コンピュータ装置のプロセッサが含むことのできる構成要素の例を示した図である。It is a figure which showed the example of the component which can include the processor of the computer apparatus in one Embodiment of this invention. 本発明の一実施形態における、コンピュータ装置が実行することのできる方法の例を示したフローチャートである。It is a flowchart which showed the example of the method which a computer apparatus can execute in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention. 本発明の一実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。It is a figure which showed the example of the user interface screen for voice recording management in one Embodiment of this invention.

以下、本発明の実施形態について、添付の図面を参照しながら詳しく説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

本発明の実施形態に係る音声記録管理システムは、少なくとも1つのコンピュータ装置によって実現されてよく、本発明の実施形態に係る音声記録管理方法は、音声記録管理システムに含まれる少なくとも1つのコンピュータ装置によって実行されてよい。このとき、コンピュータ装置においては、本発明の一実施形態に係るコンピュータプログラムがインストールされて実行されてよく、コンピュータ装置は、実行するコンピュータプログラムの制御にしたがって本発明の実施形態に係る音声記録管理方法を実行してよい。上述したコンピュータプログラムは、コンピュータ装置に結合されて音声記録管理方法をコンピュータに実行させるためにコンピュータ読み取り可能な記録媒体に記録されてよい。 The voice recording management system according to the embodiment of the present invention may be realized by at least one computer device, and the voice recording management method according to the embodiment of the present invention is realized by at least one computer device included in the voice recording management system. May be executed. At this time, in the computer device, the computer program according to the embodiment of the present invention may be installed and executed, and the computer device may control the computer program to be executed and the voice recording management method according to the embodiment of the present invention. May be executed. The computer program described above may be coupled to a computer device and recorded on a computer-readable recording medium for the computer to perform a voice recording management method.

図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されることはない。また、図1のネットワーク環境は、本実施形態に適用可能な環境の一例を説明したものに過ぎず、本実施形態に適用可能な環境が図1のネットワーク環境に限定されることはない。 FIG. 1 is a diagram showing an example of a network environment according to an embodiment of the present invention. The network environment of FIG. 1 shows an example including a plurality of electronic devices 110, 120, 130, 140, a plurality of servers 150, 160, and a network 170. Such FIG. 1 is merely an example for explaining the invention, and the number of electronic devices and the number of servers are not limited as in FIG. Further, the network environment of FIG. 1 is merely an example of an environment applicable to the present embodiment, and the environment applicable to the present embodiment is not limited to the network environment of FIG.

複数の電子機器110、120、130、140は、コンピュータ装置によって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットなどがある。一例として、図1では、電子機器110の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータ装置のうちの1つを意味してよい。 The plurality of electronic devices 110, 120, 130, 140 may be fixed terminals or mobile terminals realized by a computer device. Examples of a plurality of electronic devices 110, 120, 130, 140 include smartphones, mobile phones, navigation systems, PCs (personal computers), notebook PCs, digital broadcasting terminals, PDAs (Personal Digital Assistants), and PMPs (Portable Multimedia Players). ), Tablets, etc. As an example, FIG. 1 shows a smartphone as an example of the electronic device 110, but in the embodiment of the present invention, the electronic device 110 substantially utilizes a wireless or wired communication method, and another via the network 170. It may mean one of a variety of physical computer devices capable of communicating with the electronic devices 120, 130, 140 and / or the servers 150, 160.

通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を利用する通信方式だけではなく、機器間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。 The communication method is not limited, and not only the communication method using the communication network (for example, mobile communication network, wired Internet, wireless Internet, broadcasting network) that can be included in the network 170, but also the short distance between devices. Wireless communication may be included. For example, the network 170 includes a PAN (personal area network), a LAN (local area network), a CAN (campus area network), a MAN (metropolitan area network), a WAN (wise Internet) network, etc. It may include any one or more of the networks. Further, network 170 may include, but is limited to, any one or more of network topologies, including bus networks, star networks, ring networks, mesh networks, star-bus networks, tree or hierarchical networks, and the like. Will not be done.

サーバ150、160それぞれは、複数の電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する1つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140にサービス(一例として、音声記録管理サービス(または、議事録管理サービス)、コンテンツ提供サービス、グループ通話サービス(または、音声会議サービス)、メッセージングサービス、メールサービス、ソーシャルネットワークサービス、、地図サービス、翻訳サービス、金融サービス、決済サービス、検索サービスなど)を提供するシステムであってよい。 Each of the servers 150, 160 is realized by one or more computer devices that communicate with a plurality of electronic devices 110, 120, 130, 140 via a network 170 to provide instructions, codes, files, contents, services, and the like. good. For example, the server 150 provides services to a plurality of electronic devices 110, 120, 130, 140 connected via the network 170 (for example, a voice recording management service (or minutes management service), a content providing service, and a group call service. (Or voice conferencing service), messaging service, mail service, social network service, map service, translation service, financial service, payment service, search service, etc.) may be provided.

図2は、本発明の一実施形態における、コンピュータ装置の例を示したブロック図である。上述した複数の電子機器110、120、130、140それぞれやサーバ150、160それぞれは、図2に示したコンピュータ装置200によって実現されてよい。 FIG. 2 is a block diagram showing an example of a computer device according to an embodiment of the present invention. Each of the plurality of electronic devices 110, 120, 130, 140 and the servers 150, 160 described above may be realized by the computer device 200 shown in FIG.

このようなコンピュータ装置200は、図2に示すように、メモリ210、プロセッサ220、通信インタフェース230、および入力/出力インタフェース240を含んでよい。メモリ210は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ210とは区分される別の永続的記録装置としてコンピュータ装置200に含まれてもよい。また、メモリ210には、オペレーティングシステムと、少なくとも1つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ210とは別のコンピュータ読み取り可能な記録媒体からメモリ210にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース230を通じてメモリ210にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク170を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータ装置200のメモリ210にロードされてよい。 Such a computer device 200 may include a memory 210, a processor 220, a communication interface 230, and an input / output interface 240, as shown in FIG. The memory 210 is a computer-readable recording medium and may include a permanent mass recording device such as a RAM (random access memory), a ROM (read only memory), and a disk drive. Here, a permanent large-capacity recording device such as a ROM or a disk drive may be included in the computer device 200 as a permanent recording device separate from the memory 210. Further, the memory 210 may record an operating system and at least one program code. Such software components may be loaded into memory 210 from a computer-readable recording medium separate from memory 210. Such other computer-readable recording media may include computer-readable recording media such as floppy (registered trademark) drives, discs, tapes, DVD / CD-ROM drives, and memory cards. In other embodiments, software components may be loaded into memory 210 through a communication interface 230 that is not a computer-readable recording medium. For example, software components may be loaded into memory 210 of computer equipment 200 based on a computer program installed by a file received over network 170.

プロセッサ220は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ210または通信インタフェース230によって、プロセッサ220に提供されてよい。例えば、プロセッサ220は、メモリ210のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。 Processor 220 may be configured to process instructions in a computer program by performing basic arithmetic, logic, and input / output operations. Instructions may be provided to processor 220 by memory 210 or communication interface 230. For example, the processor 220 may be configured to execute instructions received according to program code recorded in a recording device such as memory 210.

通信インタフェース230は、ネットワーク170を介してコンピュータ装置200が他の装置(一例として、上述した記録装置)と互いに通信するための機能を提供してもよい。一例として、コンピュータ装置200のプロセッサ220がメモリ210のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース230の制御にしたがってネットワーク170を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データ、ファイルなどが、ネットワーク170を経てコンピュータ装置200の通信インタフェース230を通じてコンピュータ装置200に受信されてよい。通信インタフェース230を通じて受信された信号や命令、データなどは、プロセッサ220やメモリ210に伝達されてよく、ファイルなどは、コンピュータ装置200がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。 The communication interface 230 may provide a function for the computer device 200 to communicate with another device (for example, the recording device described above) via the network 170. As an example, requests, instructions, data, files, etc. generated by the processor 220 of the computer device 200 according to the program code recorded in the recording device such as the memory 210 are sent via the network 170 under the control of the communication interface 230. May be transmitted to the device of. On the contrary, signals, instructions, data, files and the like from other devices may be received by the computer device 200 via the communication interface 230 of the computer device 200 via the network 170. Signals, instructions, data and the like received through the communication interface 230 may be transmitted to the processor 220 and the memory 210, and the files and the like may be further contained in a recording medium (the above-mentioned permanent recording device) that can be included in the computer device 200. May be recorded.

入力/出力インタフェース240は、入力/出力装置250とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、マウスなどの装置を、出力装置は、ディスプレイ、スピーカなどのような装置を含んでよい。他の例として、入力/出力インタフェース240は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置250は、コンピュータ装置200と1つの装置で構成されてもよい。 The input / output interface 240 may be a means for an interface with the input / output device 250. For example, the input device may include a device such as a microphone, keyboard, mouse, and the output device may include a device such as a display, speaker, and the like. As another example, the input / output interface 240 may be a means for an interface with a device that integrates functions for input and output, such as a touch screen. The input / output device 250 may be composed of a computer device 200 and one device.

また、他の実施形態において、コンピュータ装置200は、図2の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術的構成要素を明確に図に示す必要はない。例えば、コンピュータ装置200は、上述した入力/出力装置250のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、データベースなどのような他の構成要素をさらに含んでもよい。 Also, in other embodiments, the computer device 200 may include fewer or more components than the components of FIG. However, most prior art components need not be clearly shown in the figure. For example, the computer device 200 may be implemented to include at least a portion of the input / output devices 250 described above, or may further include other components such as transceivers, databases, and the like.

以下では、音声ファイルに対する記録とメモをともに提供する方法およびシステムの具体的な実施形態について説明する。 In the following, a method of providing both recording and memo for an audio file and a specific embodiment of the system will be described.

最近のモバイルデバイスでは音声録音機能やメモ機能などを提供しており、多くの人が会議のような多様な状況で録音機能を活用するようになった。このとき、録音とは別に、重要な内容や添付の内容などに関しては個別にメモをとることが多々ある。 Recent mobile devices provide voice recording and memo functions, and many people have come to utilize the recording function in various situations such as meetings. At this time, apart from the recording, it is often the case that individual notes are taken regarding important contents and attached contents.

従来技術では、音声録音機能とメモ機能は個別の機能として提供されていたため、音声録音ファイルとメモを同時に確認することに困難があり、メモを見ながら内容を推測することが多かった。言い換えれば、音声とメモをそれぞれ別に確認するしかなく、これにより、録音された内容の全体の流れを把握しながらメモを確認することに困難があった。 In the conventional technology, since the voice recording function and the memo function are provided as individual functions, it is difficult to check the voice recording file and the memo at the same time, and it is often the case that the contents are guessed while looking at the memo. In other words, there was no choice but to check the voice and the memo separately, which made it difficult to check the memo while grasping the overall flow of the recorded content.

このような問題を解決するために、本実施形態では、録音された音声をテキストに変換した結果(以下、「音声記録」と称する)と、録音された音声と関連して作成されたメモをマッチングして管理する音声記録管理サービスを提供する。 In order to solve such a problem, in the present embodiment, the result of converting the recorded voice into text (hereinafter referred to as "voice recording") and the memo created in connection with the recorded voice are used. Provides a voice recording management service that matches and manages.

本実施形態は、音声録音およびテキスト変換を含む音声記録機能とメモ機能を統合された1つの機能として提供し、音声記録とメモをマッチングしてともに管理することを目的とする。 The present embodiment provides a voice recording function including voice recording and text conversion and a memo function as one integrated function, and an object thereof is to match and manage voice recording and memo together.

図3は、本発明の一実施形態における、コンピュータ装置のプロセッサが含むことのできる構成要素の例を示したブロック図であり、図4は、本発明の一実施形態における、コンピュータ装置が実行することのできる方法の例を示したフローチャートである。 FIG. 3 is a block diagram showing an example of components that can be included in a processor of a computer device according to an embodiment of the present invention, and FIG. 4 is a block diagram performed by the computer device according to the embodiment of the present invention. It is a flowchart which showed the example of the possible method.

本実施形態に係るコンピュータ装置200は、クライアントを対象に、クライアント上にインストールされた専用アプリケーションやコンピュータ装置200と関連するウェブ/モバイルサイトへの接続によって音声記録管理サービスを提供してよい。コンピュータ装置200には、コンピュータによって実現された音声記録管理システムが構成されてよい。 The computer device 200 according to the present embodiment may provide a voice recording management service to a client by connecting to a dedicated application installed on the client or a web / mobile site related to the computer device 200. The computer device 200 may be configured with a voice recording management system realized by a computer.

コンピュータ装置200のプロセッサ220は、図4に係る音声記録管理方法を実行するための構成要素として、図3に示すように、音声記録生成部310、メモマッチング管理部320、および音声記録提供部330を含んでよい。実施形態によって、プロセッサ220の構成要素は、選択的にプロセッサ220に含まれても除外されてもよい。また、実施形態によって、プロセッサ220の構成要素は、プロセッサ220の機能の表現のために分離されても併合されてもよい。 As shown in FIG. 3, the processor 220 of the computer device 200 has a voice recording generation unit 310, a memo matching management unit 320, and a voice recording providing unit 330 as components for executing the voice recording management method according to FIG. May include. Depending on the embodiment, the components of the processor 220 may be selectively included or excluded from the processor 220. Also, depending on the embodiment, the components of the processor 220 may be separated or merged to represent the functionality of the processor 220.

このようなプロセッサ220およびプロセッサ220の構成要素は、図3の音声記録管理方法が含む段階410~430を実行するようにコンピュータ装置200を制御してよい。例えば、プロセッサ220およびプロセッサ220の構成要素は、メモリ210が含むオペレーティングシステムのコードと、少なくとも1つのプログラムのコードとによる命令(instruction)を実行するように実現されてよい。 Such a processor 220 and components of the processor 220 may control the computer apparatus 200 to perform steps 410 to 430 included in the audio recording management method of FIG. For example, the processor 220 and the components of the processor 220 may be implemented to execute an instruction by the code of the operating system included in the memory 210 and the code of at least one program.

ここで、プロセッサ220の構成要素は、コンピュータ装置200に記録されたプログラムコードが提供する命令にしたがってプロセッサ220によって実行される、互いに異なる機能(different functions)の表現であってよい。例えば、コンピュータ装置200が音声記録を生成するように上述した命令にしたがってコンピュータ装置200を制御するプロセッサ220の機能的表現として、音声記録生成部310が利用されてよい。 Here, the components of the processor 220 may be representations of different functions that are executed by the processor 220 according to the instructions provided by the program code recorded in the computer apparatus 200. For example, the audio recording generator 310 may be used as a functional representation of the processor 220 that controls the computer apparatus 200 in accordance with the instructions described above so that the computer apparatus 200 generates audio recordings.

プロセッサ220は、コンピュータ装置200の制御と関連する命令がロードされたメモリ210から必要な命令を読み取ってよい。この場合、前記読み取られた命令は、以下で説明する段階410~430をプロセッサ220が実行するように制御するための命令を含んでよい。 The processor 220 may read the necessary instructions from the memory 210 in which the instructions related to the control of the computer device 200 are loaded. In this case, the read instruction may include an instruction for controlling the processor 220 to execute steps 410 to 430 described below.

以下で説明する段階410~430は、図4に示した順とは異なる順で実行されることもあるし、段階410~430のうちの一部が省略されたり追加の過程が含まれたりすることもある。 Steps 410-430, described below, may be performed in a different order than that shown in FIG. 4, and some of steps 410-430 may be omitted or include additional steps. Sometimes.

図4を参照すると、段階410で、音声記録生成部310は、クライアントから受信された音声をテキストに変換して音声記録を生成してよい。クライアント側のデバイスでは、録音機能を実行させて録音した音声ファイルを伝達してもよいし、デバイス上に記録されている音声ファイルを伝達してもよい。音声記録生成部310は、周知の音声認識技術を利用して、話者による発声区間に該当する音声データをテキストに変換した結果である音声記録を生成してよい。このとき、音声記録生成部310は、音声記録を生成する過程において話者ごとに発声区間を分割する話者分割技術を適用してよい。音声記録生成部310は、会議、インタビュー、取引、裁判などのように多くの話者が順不同に発声する状況で録音された音声ファイルの場合には、発声内容を話者ごとに分割して自動記録してよい。 Referring to FIG. 4, at step 410, the voice recording generation unit 310 may convert the voice received from the client into text to generate a voice recording. On the client-side device, the recording function may be executed to transmit the recorded audio file, or the audio file recorded on the device may be transmitted. The voice recording generation unit 310 may generate a voice recording as a result of converting the voice data corresponding to the voiced section by the speaker into text by using a well-known voice recognition technique. At this time, the voice recording generation unit 310 may apply the speaker division technique for dividing the utterance section for each speaker in the process of generating the voice recording. The voice recording generation unit 310 automatically divides the utterance content for each speaker in the case of a voice file recorded in a situation where many speakers utter in no particular order, such as a conference, an interview, a transaction, or a trial. You may record it.

段階420で、メモマッチング管理部320は、クライアントが音声録音中に作成するか音声再生中に作成したメモをクライアントから受信し、段階410で生成された音声記録とマッチングして管理してよい。メモマッチング管理部320は、クライアントが音声を録音した時間を基準として、音声記録中および録音実行中に作成されたメモをマッチングしてよい。音声記録は、話者発声区間の基点を示すタイムスタンプを含んでよく、メモマッチング管理部320は、音声記録のタイムスタンプを基準として該当の区間に作成されたメモをともに管理してよい。これと同じように、メモマッチング管理部320は、音声記録が存在する音声ファイルに対し、クライアントが音声を再生する時間を基準として、音声記録中および音声再生中に作成されたメモをマッチングして記録してよい。言い換えれば、メモマッチング管理部320は、特定の時点の発声区間に作成されたメモを該当の時点の音声記録とマッチングして管理することができる。 At step 420, the memo matching management unit 320 may receive a memo created by the client during voice recording or voice reproduction from the client and manage it by matching it with the voice recording generated in step 410. The memo matching management unit 320 may match the memos created during the voice recording and the recording execution based on the time when the client recorded the voice. The voice recording may include a time stamp indicating the base point of the speaker vocalization section, and the memo matching management unit 320 may manage the memos created in the corresponding section based on the time stamp of the voice recording. Similarly, the memo matching management unit 320 matches the memo created during the voice recording and the voice playback with the voice file in which the voice recording exists, based on the time when the client plays the voice. You may record it. In other words, the memo matching management unit 320 can manage the memo created in the utterance section at a specific time point by matching it with the voice recording at the time point.

段階430で、音声記録提供部330は、クライアントから音声記録に対する選択命令が受信される場合、該当の音声記録を音声記録とマッチングされたメモと連係させて提供してよい。音声記録提供部330は、音声録音中に作成されるか音声再生中に作成されたメモを音声記録とともに簡単かつ便利に確認できるするように、音声記録とメモをデュアルビュー方式によって並べて表示してよい。デュアルビュー方式とは、音声記録とメモを二列に並べて表示する方式であって、これは、音声をテキストに変換した音声記録と該当の音声の録音時間や再生時間に作成されたメモを並べて表示することで対話記録を簡単に探索できるようにするインタフェースを提供するものである。音声記録提供部330は、音声記録とメモをデュアル表示する方式の他にも、クライアントの選択にしたがい、音声記録とメモのうちの1つを単独表示する方式で実現されることも可能である。 At step 430, when the voice recording providing unit 330 receives the selection command for the voice recording from the client, the voice recording providing unit 330 may provide the corresponding voice recording in association with the memo matched with the voice recording. The voice recording provider 330 displays the voice recording and the memo side by side by the dual view method so that the memo created during the voice recording or the memo created during the voice reproduction can be easily and conveniently confirmed together with the voice recording. good. The dual view method is a method of displaying a voice recording and a memo side by side in two columns. In this method, a voice recording in which voice is converted into text and a memo created at the recording time and playback time of the corresponding voice are arranged side by side. It provides an interface that makes it easy to search dialogue records by displaying them. The voice recording providing unit 330 can be realized by a method of displaying one of the voice recording and the memo independently according to the client's selection, in addition to the method of dual-displaying the voice recording and the memo. ..

図5~15は、本発明の実施形態における、音声記録管理のためのユーザインタフェース画面の例を示した図である。 5 to 15 are diagrams showing an example of a user interface screen for voice recording management in the embodiment of the present invention.

図5~15は、クライアント上にインストールされた専用アプリケーションやコンピュータ装置200と関連するウェブ/モバイルサイト上のインタフェース画面であって、音声記録管理画面500の例を示している。 5 to 15 are interface screens on a web / mobile site related to a dedicated application installed on a client or a computer device 200, and show an example of a voice recording management screen 500.

図5~9は、音声記録を生成する過程を説明するための音声記録管理画面500の例を示してる。 5 to 9 show an example of a voice recording management screen 500 for explaining a process of generating a voice recording.

図5を参照すると、音声記録管理画面500は、音声記録管理サービスのホーム画面構成であって、サービス提供のための主要メニューリストが含まれてよく、一例として、音声記録をフォルダ単位で管理するためのフォルダリスト501が含まれてよい。また、音声記録管理画面500には、新たな音声記録を生成するための「新規ノート作成」メニュー502が含まれてよい。 Referring to FIG. 5, the voice recording management screen 500 is a home screen configuration of the voice recording management service, and may include a main menu list for providing the service. As an example, the voice recording is managed in folder units. Folder list 501 for this may be included. Further, the voice recording management screen 500 may include a "new note creation" menu 502 for generating a new voice recording.

プロセッサ220は、音声記録管理画面500から「新規ノート作成」メニュー502が選択される場合、図6に示すように、音声記録生成画面610を提供してよい。音声記録生成画面610には、音声記録のタイトルを入力するための「タイトル」入力欄611、参加者情報を入力するための「参加者」入力欄612、音声録音のための「録音開始」メニュー613、音声ファイルをアップロードするための「ファイルアップロード」メニュー614などが含まれてよい。言い換えれば、プロセッサ220は、音声記録を生成するために、録音機能とファイルアップロード機能を提供してよい。 The processor 220 may provide the voice recording generation screen 610, as shown in FIG. 6, when the "new note creation" menu 502 is selected from the voice recording management screen 500. The voice recording generation screen 610 has a "title" input field 611 for inputting a voice recording title, a "participant" input field 612 for inputting participant information, and a "recording start" menu for voice recording. 613, a "file upload" menu 614 for uploading audio files, and the like may be included. In other words, the processor 220 may provide recording and file uploading capabilities to generate audio recordings.

プロセッサ220は、音声記録生成画面610から「録音開始」メニュー613が選択される場合、図7に示すように、音声録音画面720を提供してよい。音声録音画面720は、基本的な録音インタフェースであって、録音が実行された時間情報、録音を一時停止するための一時停止ボタン、録音を終了するための終了ボタンなどが含まれてよい。 The processor 220 may provide a voice recording screen 720, as shown in FIG. 7, when the "recording start" menu 613 is selected from the voice recording generation screen 610. The voice recording screen 720 is a basic recording interface, and may include information on the time when the recording was executed, a pause button for pausing the recording, an end button for ending the recording, and the like.

特に、音声録音画面720は、録音中にメモを作成できるようにするメモインタフェース721と、録音中にブックマークを記録できるようにするブックマークインタフェース722が含まれてよい。このとき、メモインタフェース721は、テキストによる入力はもちろん、写真や動画撮影機能、ファイル添付機能などが含まれてよい。ユーザは、メモインタフェース721を利用することで、録音中に該当の音声と関連する重要な内容や添付の内容などをメモとして作成することができ、メモの他にも、ブックマークインタフェース722を利用することで、重要区間の録音時点にブックマークを記録することができる。録音実行時間を基準として録音中に入力されたメモやブックマークが記録されてよく、例えば、メモの作成が始まった時点の録音実行時間がメモ作成時間に記録されてよく、ブックマークが入力された時点の録音実行時間がブックマーク指定時間として記録されてよい。 In particular, the voice recording screen 720 may include a memo interface 721 that allows a memo to be created during recording and a bookmark interface 722 that allows bookmarks to be recorded during recording. At this time, the memo interface 721 may include not only text input but also a photo and moving image shooting function, a file attachment function, and the like. By using the memo interface 721, the user can create important contents and attached contents related to the corresponding voice as a memo during recording, and uses the bookmark interface 722 in addition to the memo. Therefore, the bookmark can be recorded at the time of recording the important section. The memo or bookmark entered during recording may be recorded based on the recording execution time. For example, the recording execution time at the time when the memo creation starts may be recorded in the memo creation time, and the time when the bookmark is input. The recording execution time of is recorded as the bookmark specified time.

音声記録に対するブックマークとしては、ブックマークインタフェース722を利用した手動設定を説明しているが、これに限定されてはならず、自動設定機能による実現も可能である。例えば、事前に定められた主要キーワード(一例として、音声記録のタイトルやタグなど)が発声される区間にブックマークが自動で記録されるようにしてよい。 As the bookmark for voice recording, the manual setting using the bookmark interface 722 is described, but the setting is not limited to this, and the bookmark can be realized by the automatic setting function. For example, a bookmark may be automatically recorded in a section in which a predetermined main keyword (for example, a title or tag of a voice recording) is uttered.

プロセッサ220は、音声記録生成画面610から「ファイルアップロード」メニュー614が選択される場合、クライアントが音声ファイルを探索できるようにするためのファイル探索画面を提供し、ファイル探索画面から特定のファイルが選択されれば、図8に示すように、選択されたファイルをアップロードするファイルアップロード画面830を提供してよい。ファイルアップロード画面830には、選択されたファイに関する情報(例えば、ファイル名、ファイルの長さなど)とともに、ファイルアップロードの進行状況を示すプログレスバー831が含まれてよい。 The processor 220 provides a file search screen for allowing the client to search for a voice file when the "file upload" menu 614 is selected from the voice record generation screen 610, and a specific file is selected from the file search screen. If so, as shown in FIG. 8, a file upload screen 830 for uploading the selected file may be provided. The file upload screen 830 may include a progress bar 831 indicating the progress of the file upload, along with information about the selected file (eg, file name, file length, etc.).

プロセッサ220は、音声録音画面720による音声録音が完了するか、ファイルアップロード画面830によるファイルアップロードが完了すれば、図9に示すように、音声をテキストに変換する音声記録生成過程の進行状況915を音声記録生成画面610に表示してよい。録音の場合は、録音と同時進行で音声ファイルがリアルタイムでアップロードされるか、あるいは録音の完了にともなって録音された音声ファイル全体が一括アップロードされてよい。 When the voice recording by the voice recording screen 720 is completed or the file upload by the file upload screen 830 is completed, the processor 220 determines the progress 915 of the voice recording generation process for converting the voice into text, as shown in FIG. It may be displayed on the voice recording generation screen 610. In the case of recording, the audio file may be uploaded in real time at the same time as the recording, or the entire recorded audio file may be uploaded at once when the recording is completed.

プロセッサ220は、音声記録生成過程が完了した音声ファイルに対し、音声記録とメモ(および、ブックマーク)を時間的にマッチングしてともに提供してよい。 The processor 220 may provide the voice recording and the memo (and the bookmark) together with the voice file for which the voice recording generation process has been completed, matching in time.

図10~15は、音声記録を提供する過程を説明するための音声記録管理画面500の例を示した図である。 10 to 15 are diagrams showing an example of a voice recording management screen 500 for explaining a process of providing voice recording.

図10を参照すると、プロセッサ220は、音声記録管理画面500に提供されたファイルリストから特定の音声記録が選択される場合、該当のタイトルの音声記録に対し、デュアルビュー方式によって音声記録領域1040とメモ領域1050をともに表示してよい。音声記録管理画面500には、音声記録生成過程で入力されたタイトル1041と参加者情報1042が提供されてよく、音声ファイルの再生を制御するためのコントローラ領域1060が含まれてよい。 Referring to FIG. 10, when a specific audio recording is selected from the file list provided on the audio recording management screen 500, the processor 220 and the audio recording area 1040 by the dual view method for the audio recording of the corresponding title. The memo area 1050 may be displayed together. The voice recording management screen 500 may be provided with the title 1041 and the participant information 1042 input in the voice recording generation process, and may include a controller area 1060 for controlling the reproduction of the voice file.

音声記録領域1040では、各区間の音声を変換したテキストが発声区間ごとに表示されてよい。このとき、音声ファイルでテキストが表示される時点を基準にタイムスタンプが表示されてよい。メモ領域1050には、音声ファイルの録音中に作成されたメモが表示されてよく、各メモには、メモ作成が始まった時点の録音実行時間が該当のメモのタイムスタンプとして表示されてよい。 In the voice recording area 1040, the text obtained by converting the voice of each section may be displayed for each utterance section. At this time, the time stamp may be displayed based on the time when the text is displayed in the audio file. In the memo area 1050, a memo created during the recording of the audio file may be displayed, and the recording execution time at the time when the memo creation starts may be displayed as a time stamp of the corresponding memo in each memo.

プロセッサ220は、音声記録領域1040とメモ領域1050を二列で並べて表示してよい。このとき、音声記録領域1040とメモ領域1050は、タイムスタンプを基準にマッチングさせて表示してよい。例えば、話者1が発声した00分02秒時点に作成されたメモは、該当の発声区間のテキストと同一線上に表示してよい。 The processor 220 may display the voice recording area 1040 and the memo area 1050 side by side in two columns. At this time, the voice recording area 1040 and the memo area 1050 may be displayed by matching with each other based on the time stamp. For example, the memo created at 00:02 seconds when the speaker 1 utters may be displayed on the same line as the text of the utterance section.

音声記録領域1040とメモ領域1050をタイムスタンプに基づく同一線上に表示するのではなく、単にそれぞれの時間順にしたがって整列することも可能である。この他にも、音声記録領域1040とメモ領域1050を整列する方式は、デュアルビュー方式の範囲内であれば、いくらでも変更可能である。 Instead of displaying the voice recording area 1040 and the memo area 1050 on the same line based on the time stamp, it is also possible to simply arrange them in the respective time order. In addition to this, the method of arranging the voice recording area 1040 and the memo area 1050 can be changed as long as it is within the range of the dual view method.

コントローラ領域1060には、プログレスバー、再生/一時停止ボタン、早送りボタン、巻き戻しボタン、音量調節ボタンなどが含まれてよく、メモが作成された区間を示すメモインジケータ1061とブックマークが記録された区間を示すブックマークインジケータ1062が、プログレスバー上に表示されてよい。 The controller area 1060 may include a progress bar, a play / pause button, a fast forward button, a rewind button, a volume control button, etc., and a memo indicator 1061 indicating the section in which the memo was created and a section in which the bookmark is recorded. A bookmark indicator 1062 may be displayed on the progress bar.

メモインジケータ1061とブックマークインジケータ1062を一目で区分できるように、インジケータのディスプレイ要素(例えば、色や形状など)を互いに異なるように適用してよい。 Display elements of the indicator (eg, color, shape, etc.) may be applied differently from each other so that the memo indicator 1061 and the bookmark indicator 1062 can be distinguished at a glance.

プロセッサ220は、ユーザが音声記録領域1040から特定の発声区間のテキストを選択する場合、該当の区間の音声を再生してよい。メモ領域1050から特定のメモを選択する場合も同じように、該当のメモが作成された区間の音声が再生されてもよい。 When the user selects the text of a specific utterance section from the voice recording area 1040, the processor 220 may reproduce the voice of the section. Similarly, when selecting a specific memo from the memo area 1050, the voice of the section in which the corresponding memo is created may be reproduced.

プロセッサ220は、音声記録領域1040とメモ領域1050の相互間の選択領域を同期化してよい。例えば、ユーザが音声記録領域1040から特定の発声区間のテキストが選択される場合、該当の区間に作成されたメモ領域1050内のメモをハイライト表示してよい。 The processor 220 may synchronize the selection area between the voice recording area 1040 and the memo area 1050. For example, when the user selects text in a specific vocalization section from the voice recording area 1040, the memo in the memo area 1050 created in the corresponding section may be highlighted.

ユーザは、音声記録領域1040とメモ領域1050を同時に確認することができ、コントローラ領域1060内のプログレスバー上のメモインジケータ1061とブックマークインジケータ1062によって簡単かつ便利な探索が可能となるため、対話内容を一目で把握することが可能となる。 The user can check the voice recording area 1040 and the memo area 1050 at the same time, and the memo indicator 1061 and the bookmark indicator 1062 on the progress bar in the controller area 1060 enable a simple and convenient search. It is possible to grasp at a glance.

図11を参照すると、プロセッサ220は、音声記録領域1040でブックマークが指定された発声区間のテキストを他の区間のテキストと区別して表示してよく、例えば、該当の区間のテキストに対してブックマークアイコン1171を表示してよい。ブックマークアイコン1171を表示する以外にも、ブックマークが指定された発声区間のテキストにハイライトを適用することも可能である。 Referring to FIG. 11, the processor 220 may display the text of the vocalization section for which the bookmark is specified in the voice recording area 1040 separately from the text of the other section, for example, the bookmark icon for the text of the corresponding section. 1171 may be displayed. In addition to displaying the bookmark icon 1171, it is also possible to apply highlights to the text of the vocalization section to which the bookmark is specified.

また、プロセッサ220は、音声記録領域1040でブックマークが指定された発声区間のテキストに対して「編集」メニュー1172を提供し、ブックマーク区間のテキスト編集を誘導してもよい。 Further, the processor 220 may provide an "edit" menu 1172 for the text in the vocalized section for which the bookmark is designated in the voice recording area 1040, and may guide the text editing in the bookmarked section.

プロセッサ220は、音声記録領域1040でブックマークが指定された発声区間のテキストに対して「編集」メニュー1172が選択される場合、図12に示すように、該当の区間のテキストを編集できるようにする編集画面1270を提供してよい。音声記録領域1040でブックマークが指定された発声区間のテキストは、編集画面1270で編集されたテキストに更新されてよい。 When the "Edit" menu 1172 is selected for the text of the vocalized section for which the bookmark is specified in the voice recording area 1040, the processor 220 enables the text of the section to be edited as shown in FIG. The edit screen 1270 may be provided. The text of the vocalization section for which the bookmark is specified in the voice recording area 1040 may be updated with the text edited on the edit screen 1270.

プロセッサ220は、音声記録領域1040に含まれたブックマーク区間の他にも、発声区間のテキストそれぞれに対して編集機能を提供してもよく、メモ領域1050に含まれたメモを編集できるようにする機能を提供してもよい。 The processor 220 may provide an editing function for each of the texts in the utterance section in addition to the bookmark section included in the voice recording area 1040, so that the memo included in the memo area 1050 can be edited. Functions may be provided.

また、プロセッサ220は、音声記録領域1040とメモ領域1050に対し、話者やキーワードなどを利用したグルーピングによるフィルタリング機能を提供してよい。 Further, the processor 220 may provide a filtering function by grouping using a speaker, a keyword, or the like for the voice recording area 1040 and the memo area 1050.

プロセッサ220は、音声記録領域1040から特定の話者が選択される場合、該当の話者の発声区間に対する音声記録とメモのうちの少なくとも1つをグルーピングして表示してよい。言い換えれば、特定の話者が発声した区間の音声記録と該当の話者の発声区間に対して作成されたメモを1つにまとめて表示してよい。 When a specific speaker is selected from the voice recording area 1040, the processor 220 may group and display at least one of the voice recording and the memo for the vocalization section of the speaker. In other words, the voice recording of the section uttered by a specific speaker and the memo created for the utterance section of the corresponding speaker may be displayed together.

また、プロセッサ220は、ユーザが入力したキーワードを基準に、該当のキーワードを含む音声記録とメモのうちの少なくとも1つをグルーピングして表示することも可能である。キーワードを利用したメモグルーピングの場合は、該当のキーワードを含むメモ、または該当のキーワードを含む発声区間に作成されたメモをグルーピング対象としてよい。話者やキーワードの他にも、音声記録とメモを分類することのできる多様な基準がフィルタリングに活用されてよい。 Further, the processor 220 can also group and display at least one of the voice recording and the memo including the keyword based on the keyword input by the user. In the case of memo grouping using keywords, memos containing the relevant keyword or memos created in the vocalization section containing the relevant keyword may be grouped. In addition to speakers and keywords, various criteria that can classify voice recordings and memos may be used for filtering.

プロセッサ220は、音声記録領域1040とメモ領域1050をともに表示するデュアルビュー方式の他にも、ユーザの選択にしたがい、音声記録領域1040とメモ領域1050のうちの1つを選択的に表示するビューモードを提供してよい。 In addition to the dual view system that displays both the voice recording area 1040 and the memo area 1050, the processor 220 selectively displays one of the voice recording area 1040 and the memo area 1050 according to the user's selection. Modes may be provided.

図13を参照すると、プロセッサ220は、音声記録領域1040は表示せずにメモ領域1050だけを表示してよい。このとき、音声ファイルの再生を制御するためのコントローラ領域1060がともに提供されてよい。 Referring to FIG. 13, the processor 220 may display only the memo area 1050 without displaying the voice recording area 1040. At this time, a controller area 1060 for controlling the reproduction of the audio file may be provided together.

ユーザは、音声を聞きながらメモ領域1050に含まれたメモの確認が可能となるが、さらに、プロセッサ220は、音声再生中にメモを追加で作成できるようにするインタフェースを提供してよい。 The user can check the memo contained in the memo area 1050 while listening to the voice, and the processor 220 may further provide an interface that allows additional memos to be created during voice reproduction.

図14を参照すると、プロセッサ220は、メモ領域1050は表示せずに音声記録領域1040だけを表示してよい。このとき、音声ファイルの再生を制御するためのコントローラ領域1060がともに提供されてよい。 Referring to FIG. 14, the processor 220 may display only the voice recording area 1040 without displaying the memo area 1050. At this time, a controller area 1060 for controlling the reproduction of the audio file may be provided together.

音声記録領域1040だけを表示するビューモードでは、音声記録領域1040でメモが作成された発声区間のテキストを他の区間のテキストと区別して表示してよく、例えば、該当のテキストの発声区間には作成されたメモが存在することを示すタグとしてメモアイコン1441を表示してよい。 In the view mode in which only the voice recording area 1040 is displayed, the text of the vocalization section in which the memo is created in the voice recording area 1040 may be displayed separately from the texts of other sections. The memo icon 1441 may be displayed as a tag indicating that the created memo exists.

プロセッサ220は、音声記録領域1040から特定のテキストのメモアイコン1441が選択される場合、図15に示すように、該当のテキストの発声区間に作成されたメモの全文1580を表示してよい。 When the memo icon 1441 of a specific text is selected from the voice recording area 1040, the processor 220 may display the full text 1580 of the memo created in the vocalization section of the text, as shown in FIG.

音声記録領域1040とメモ領域1050をともに表示するデュアルビューモードはもちろん、音声記録領域1040とメモ領域1050のうちの1つを選択的に表示するビューモードでも、相互間の探索と確認を可能にするインタフェースが提供されてよい。 Not only the dual view mode that displays both the voice recording area 1040 and the memo area 1050, but also the view mode that selectively displays one of the voice recording area 1040 and the memo area 1050 enables mutual search and confirmation. Interfaces may be provided.

このように、本発明の実施形態によると、録音された音声をテキストに変換した記録と録音された音声と関連して作成されたメモをマッチングしてデュアルビューとして表示することにより、音声記録とメモを便利に探索することができる。 As described above, according to the embodiment of the present invention, the recording of the recorded voice converted into text and the memo created in connection with the recorded voice are matched and displayed as a dual view to perform voice recording. You can conveniently search for notes.

また、本発明の実施形態によると、音声記録とメモを話者またはキーワードごとにグルーピングするフィルタリング機能を提供することにより、サービス利用に対するユーザの利便性を向上させることができる。 Further, according to the embodiment of the present invention, it is possible to improve the convenience of the user for using the service by providing the filtering function for grouping the voice recording and the memo for each speaker or keyword.

上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者であれば、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。 The devices described above may be implemented by hardware components, software components, and / or combinations of hardware components and software components. For example, the apparatus and components described in the embodiments include a processor, a controller, an ALU (arithmetic logic unit), a digital signal processor, a microcomputer, an FPGA (field programgable gate array), a PLU (programmable log unit), a microprocessor, and the like. Alternatively, it may be implemented using one or more general purpose computers or special purpose computers, such as various devices capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the OS. The processing device may also respond to the execution of the software, access the data, and record, manipulate, process, and generate the data. For convenience of understanding, one processing device may be described as being used, but those skilled in the art may include a plurality of processing elements and / or a plurality of types of processing elements. You can understand that. For example, the processing device may include multiple processors or one processor and one controller. Also, other processing configurations such as parallel processors are possible.

ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。 The software may include computer programs, codes, instructions, or a combination of one or more of these, configuring the processing equipment to operate at will, or instructing the processing equipment independently or collectively. You may do it. The software and / or data is embodied in any type of machine, component, physical device, computer recording medium or device to be interpreted based on the processing device or to provide instructions or data to the processing device. good. The software is distributed on a computer system connected by a network and may be recorded or executed in a distributed state. The software and data may be recorded on one or more computer-readable recording media.

実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。ここで、媒体は、コンピュータ実行可能なプログラムを継続して記録するものであっても、実行またはダウンロードのために一時記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続する媒体に限定されることはなく、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD-ROMおよびDVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどを含み、プログラム命令が記録されるように構成されたものであってよい。また、媒体の他の例として、アプリケーションを配布するアプリケーションストアやその他の多様なソフトウェアを供給または配布するサイト、サーバなどで管理する記録媒体または格納媒体が挙げられる。 The method according to the embodiment may be realized in the form of program instructions that can be executed by various computer means and recorded on a computer-readable medium. Here, the medium may be a continuous recording of a computer-executable program or a temporary recording for execution or download. Further, the medium may be various recording means or storage means in the form of a combination of a single piece of hardware or a plurality of pieces of hardware, and is not limited to a medium directly connected to a certain computer system, but is distributed over a network. It may exist. Examples of media include hard disks, floppy (registered trademark) disks, magnetic media such as magnetic tapes, optical media such as CD-ROMs and DVDs, optical magnetic media such as floptic discs, and the like. And may include ROM, RAM, flash memory, etc., and may be configured to record program instructions. Other examples of media include recording media or storage media managed by application stores that distribute applications, sites that supply or distribute various other software, servers, and the like.

以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。 As described above, the embodiments have been described based on the limited embodiments and drawings, but those skilled in the art will be able to make various modifications and modifications from the above description. For example, the techniques described may be performed in a different order than the methods described, and / or components such as the systems, structures, devices, circuits described may be in a different form than the methods described. Appropriate results can be achieved even if they are combined or combined, and confronted or replaced by other components or equivalents.

したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付される特許請求の範囲に属する。 Therefore, even if it is a different embodiment, if it is equivalent to the claims, it belongs to the attached claims.

222:プロセッサ
310:音声記録生成部
320:メモマッチング管理部
330:音声記録提供部
222: Processor 310: Voice recording generation unit 320: Memo matching management unit 330: Voice recording providing unit

Claims (20)

コンピュータ装置が実行する音声記録管理方法であって、
前記コンピュータ装置は、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記音声記録管理方法は、
前記少なくとも1つのプロセッサにより、音声をテキストに変換して音声記録を生成する段階、
前記少なくとも1つのプロセッサにより、前記音声の録音中または再生中に作成されたメモを前記音声記録とマッチングして管理する段階、および
前記少なくとも1つのプロセッサにより、前記音声記録と前記メモを連係させて提供する段階
を含む、音声記録管理方法。
A voice recording management method performed by a computer device.
The computer device comprises at least one processor configured to execute a computer-readable instruction contained in memory.
The voice recording management method is
The step of converting speech into text by the at least one processor to generate a speech recording,
A step of matching and managing a memo created during recording or playback of the voice by the at least one processor, and linking the voice recording and the memo by the at least one processor. Audio recording management methods, including the steps to provide.
前記提供する段階は、
デュアルビュー方式によって前記音声記録と前記メモをともに表示する段階
を含む、請求項1に記載の音声記録管理方法。
The above-mentioned stage of provision is
The voice recording management method according to claim 1, further comprising displaying both the voice recording and the memo by a dual view method.
前記提供する段階は、
タイムスタンプを基準として前記音声記録と前記メモを時間的にマッチングして表示する段階
を含む、請求項1に記載の音声記録管理方法。
The above-mentioned stage of provision is
The voice recording management method according to claim 1, further comprising a step of temporally matching and displaying the voice recording and the memo based on a time stamp.
前記提供する段階は、
前記音声記録について、話者発声区間のテキストごとに、該当の区間の基点を示すタイムスタンプを表示する段階、および
前記メモについて、メモごとに、メモ作成時点の音声録音時間または音声再生時間を示すタイムスタンプを表示する段階
を含む、請求項1に記載の音声記録管理方法。
The above-mentioned stage of provision is
For the voice recording, the stage of displaying a time stamp indicating the base point of the corresponding section for each text of the speaker vocalization section, and for each memo, the voice recording time or voice reproduction time at the time of memo creation is shown. The audio recording management method according to claim 1, which comprises a step of displaying a time stamp.
前記提供する段階は、
前記音声記録に含まれた話者発声区間のテキストに対し、該当の区間に作成されたメモの有無によってメモタグを表示する段階、および
前記メモタグが選択される場合、該当のテキストの発声区間に作成されたメモの全文を表示する段階
を含む、請求項1に記載の音声記録管理方法。
The above-mentioned stage of provision is
For the text of the speaker vocalization section included in the voice recording, the stage of displaying the memo tag depending on the presence or absence of the memo created in the corresponding section, and when the memo tag is selected, it is created in the vocalization section of the corresponding text. The voice recording management method according to claim 1, which comprises a step of displaying the full text of the memo.
前記生成する段階は、
クライアントが録音した音声ファイルまたは前記クライアントがアップロードした音声ファイルを受信し、話者発声区間に該当する音声データをテキストに変換する段階
を含む、請求項1に記載の音声記録管理方法。
The generation stage is
The voice recording management method according to claim 1, further comprising a step of receiving a voice file recorded by a client or a voice file uploaded by the client and converting voice data corresponding to a speaker vocalization section into text.
前記管理する段階は、
前記音声記録のタイムスタンプを基準として前記音声の録音中または再生中に作成されたメモをマッチングして管理すること
を特徴とする、請求項1に記載の音声記録管理方法。
The management stage is
The voice recording management method according to claim 1, wherein the memos created during recording or reproduction of the voice are matched and managed based on the time stamp of the voice recording.
前記音声の話者発声区間に作成されたメモを前記話者発声区間の音声記録とマッチングして管理する段階は、
前記音声の話者発声区間ごとに、作成されたメモを前記話者発声区間の音声記録とマッチングして管理すること
を特徴とする、請求項1に記載の音声記録管理方法。
The stage of managing the memo created in the speaker vocalization section of the voice by matching with the voice recording of the speaker vocalization section is
The voice recording management method according to claim 1, wherein the created memo is managed by matching with the voice recording of the speaker vocalization section for each speaker vocalization section of the voice.
前記音声記録管理方法は、
前記少なくとも1つのプロセッサにより、前記音声の録音中または再生中に少なくとも1つの話者発声区間にブックマークを記録する段階
をさらに含み、
前記提供する段階は、
前記音声記録に含まれたテキストのうち、ブックマークが記録された話者発声区間のテキストに対して編集機能を提供する段階
を含む、請求項1に記載の音声記録管理方法。
The voice recording management method is
Further including the step of recording a bookmark in at least one speaker vocalization section by the at least one processor during recording or reproduction of the voice.
The above-mentioned stage of provision is
The voice recording management method according to claim 1, further comprising a step of providing an editing function for the text of the speaker vocalization section in which the bookmark is recorded among the texts included in the voice recording.
前記提供する段階は、
話者またはキーワードを利用して、前記音声記録と前記メモのうちの少なくとも1つをグルーピングして提供する段階
を含む、請求項1に記載の音声記録管理方法。
The above-mentioned stage of provision is
The voice recording management method according to claim 1, further comprising a step of grouping and providing at least one of the voice recording and the memo by using a speaker or a keyword.
請求項1~10のうちのいずれか一項に記載の音声記録管理方法をコンピュータに実行させるためのプログラムが記録されている、コンピュータ読み取り可能な記録媒体。 A computer-readable recording medium in which a program for causing a computer to execute the voice recording management method according to any one of claims 1 to 10 is recorded. コンピュータ装置であって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
音声をテキストに変換して音声記録を生成する音声記録生成部、
前記音声の録音中または再生中に作成されたメモを前記音声記録とマッチングして管理するメモマッチング管理部、および
前記音声記録と前記メモと連係させて提供する音声記録提供部
を含む、コンピュータ装置。
It ’s a computer device,
Contains at least one processor configured to execute computer-readable instructions contained in memory.
The at least one processor
Voice recording generator, which converts voice to text and generates voice recording
A computer device including a memo matching management unit that matches and manages a memo created during recording or playback of the voice with the voice recording, and a voice recording providing unit that links the voice recording with the memo and manages the memo. ..
前記音声記録提供部は、
デュアルビュー方式によって前記音声記録と前記メモをともに表示すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording providing unit is
The computer device according to claim 12, wherein both the voice recording and the memo are displayed by the dual view method.
前記音声記録提供部は、
タイムスタンプを基準として前記音声記録と前記メモを時間的にマッチングして表示すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording providing unit is
The computer device according to claim 12, wherein the voice recording and the memo are temporally matched and displayed with reference to a time stamp.
前記音声記録提供部は、
前記音声記録の場合は、話者発声区間のテキストごとに、該当の区間の基点を示すタイムスタンプを表示し、
前記メモの場合は、メモごとに、メモ作成時点の音声録音時間または音声再生時間を示すタイムスタンプを表示すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording providing unit is
In the case of the voice recording, a time stamp indicating the base point of the corresponding section is displayed for each text of the speaker vocalization section.
The computer device according to claim 12, wherein in the case of the memo, a time stamp indicating a voice recording time or a voice reproduction time at the time of creating the memo is displayed for each memo.
前記音声記録提供部は、
前記音声記録に含まれた話者発声区間のテキストに対し、該当の区間に作成されたメモの有無によってメモタグを表示し、
前記メモタグが選択される場合、該当のテキストの発声区間に作成されたメモの全文を表示すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording providing unit is
For the text of the speaker utterance section included in the voice recording, a memo tag is displayed depending on the presence or absence of the memo created in the corresponding section.
12. The computer device according to claim 12, wherein when the memo tag is selected, the full text of the memo created in the vocalization section of the corresponding text is displayed.
前記音声記録生成部は、
クライアントが録音した音声ファイルまたは前記クライアントがアップロードした音声ファイルを受信し、話者発声区間に該当する音声データをテキストに変換すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording generation unit is
The computer device according to claim 12, wherein the computer device according to claim 12, receives a voice file recorded by a client or a voice file uploaded by the client, and converts voice data corresponding to a speaker vocalization section into text.
前記メモマッチング管理部は、
前記音声記録のタイムスタンプを基準として前記音声の録音中または再生中に作成されたメモをマッチングして管理すること
を特徴とする、請求項12に記載のコンピュータ装置。
The memo matching management unit
The computer device according to claim 12, wherein the memos created during the recording or reproduction of the voice are matched and managed based on the time stamp of the voice recording.
前記メモマッチング管理部は、
前記音声の録音中または再生中に少なくとも1つの話者発声区間にブックマークを記録し、
前記音声記録提供部は、
前記音声記録に含まれたテキストのうち、ブックマークが記録された話者発声区間のテキストに対して編集機能を提供すること
を特徴とする、請求項12に記載のコンピュータ装置。
The memo matching management unit
A bookmark is recorded in at least one speaker vocalization section during recording or playback of the voice.
The voice recording providing unit is
The computer device according to claim 12, wherein among the texts included in the voice recording, an editing function is provided for the text of the speaker vocalization section in which the bookmark is recorded.
前記音声記録提供部は、
話者またはキーワードを利用して、前記音声記録と前記メモのうちの少なくとも1つをグルーピングして提供すること
を特徴とする、請求項12に記載のコンピュータ装置。
The voice recording providing unit is
12. The computer device according to claim 12, wherein at least one of the voice recording and the memo is grouped and provided by using a speaker or a keyword.
JP2021021396A 2020-09-23 2021-02-15 METHOD, SYSTEM, AND COMPUTER-READABLE RECORDING MEDIUM FOR MANAGING TEXT TRANSFORMATION RECORD AND MEMO TO VOICE FILE Active JP7166373B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0122847 2020-09-23
KR1020200122847A KR102427213B1 (en) 2020-09-23 2020-09-23 Method, system, and computer readable record medium to manage together text conversion record and memo for audio file

Publications (2)

Publication Number Publication Date
JP2022052695A true JP2022052695A (en) 2022-04-04
JP7166373B2 JP7166373B2 (en) 2022-11-07

Family

ID=80948336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021021396A Active JP7166373B2 (en) 2020-09-23 2021-02-15 METHOD, SYSTEM, AND COMPUTER-READABLE RECORDING MEDIUM FOR MANAGING TEXT TRANSFORMATION RECORD AND MEMO TO VOICE FILE

Country Status (2)

Country Link
JP (1) JP7166373B2 (en)
KR (2) KR102427213B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010238050A (en) * 2009-03-31 2010-10-21 Nec Corp Browsing system and method, and program
JPWO2016163028A1 (en) * 2015-04-10 2018-02-01 株式会社東芝 Statement presentation device, statement presentation method, and program
JP2018097239A (en) * 2016-12-15 2018-06-21 カシオ計算機株式会社 Voice reproduction device and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101844903B1 (en) * 2011-08-31 2018-04-04 삼성전자 주식회사 Providing Method for Data Complex Recording And Portable Device thereof
KR102042265B1 (en) * 2012-03-30 2019-11-08 엘지전자 주식회사 Mobile terminal
JP2016163028A (en) 2015-03-05 2016-09-05 トヨタ自動車株式会社 Method of producing thermoelectric material

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010238050A (en) * 2009-03-31 2010-10-21 Nec Corp Browsing system and method, and program
JPWO2016163028A1 (en) * 2015-04-10 2018-02-01 株式会社東芝 Statement presentation device, statement presentation method, and program
JP2018097239A (en) * 2016-12-15 2018-06-21 カシオ計算機株式会社 Voice reproduction device and program

Also Published As

Publication number Publication date
JP7166373B2 (en) 2022-11-07
KR102427213B1 (en) 2022-08-01
KR20220040083A (en) 2022-03-30
KR20220110689A (en) 2022-08-09

Similar Documents

Publication Publication Date Title
US7735012B2 (en) Audio user interface for computing devices
US8122355B2 (en) Information processing apparatus, information processing method, information processing program and recording medium
JP2010140506A (en) Apparatus for annotating document
TWI807428B (en) Method, system, and computer readable record medium to manage together text conversion record and memo for audio file
JP2022061932A (en) Method, system and computer-readable recording medium for creating memorandum for voice file by linkage between application and website
US20130204414A1 (en) Digital audio communication system
KR20210050410A (en) Method and system for suppoting content editing based on real time generation of synthesized sound for video content
US20220326906A1 (en) Systems and methods for dynamically synthesizing audio files on a mobile device
JP6144477B2 (en) Collaboration singing video display system
JP2022065601A (en) Method for managing voice recording in linkage with artificial intelligence device, system, and computer readable recording medium
JP2022052695A (en) Method, system, and computer-readable recording medium for managing text-converted record and memo for voice file together
KR102677498B1 (en) Method, system, and computer readable record medium to search for words with similar pronunciation in speech-to-text records
KR20180014966A (en) Method for providing sharing new song to connect songwriter with singer
JP2022068817A (en) Method for improving voice recognition rate for voice recording, system, and computer readable recording medium
JP2022056307A (en) Method, system and computer-readable recording medium for search including word of similar pronunciation from speech recording having speech converted into text
JP7128222B2 (en) Content editing support method and system based on real-time generation of synthesized sound for video content
JP2022069370A (en) Method and system for recording conversations by working with image communication service, and computer readable recording medium
EP4322028A1 (en) Data processing apparatuses and methods
JP6013879B2 (en) Collaboration singing system
JP2021067845A (en) Voice reproduction system and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210215

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20210414

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221025

R150 Certificate of patent or registration of utility model

Ref document number: 7166373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350