CN101030129A - 一种文语同步记录方法及其装置 - Google Patents

一种文语同步记录方法及其装置 Download PDF

Info

Publication number
CN101030129A
CN101030129A CN 200610011432 CN200610011432A CN101030129A CN 101030129 A CN101030129 A CN 101030129A CN 200610011432 CN200610011432 CN 200610011432 CN 200610011432 A CN200610011432 A CN 200610011432A CN 101030129 A CN101030129 A CN 101030129A
Authority
CN
China
Prior art keywords
voice signal
processing unit
synchronous
signal information
literal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610011432
Other languages
English (en)
Other versions
CN100483332C (zh
Inventor
史晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suxun Science & Technology Co Ltd
Original Assignee
Suxun Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suxun Science & Technology Co Ltd filed Critical Suxun Science & Technology Co Ltd
Priority to CNB2006100114328A priority Critical patent/CN100483332C/zh
Publication of CN101030129A publication Critical patent/CN101030129A/zh
Application granted granted Critical
Publication of CN100483332C publication Critical patent/CN100483332C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种文语同步记录方法及其装置,该装置包括文字处理单元、语音处理单元,其特征在于,该装置还包括:一同步处理单元,连接所述文字处理单元、所述语音处理单元,用于接收由所述文字处理单元输出的文字、键盘输入信息和在同一时间接收由所述语音处理单元输出的声音信号信息,并对所述文字、键盘输入信息和所述声音信号信息进行同步组合处理,生成同步记录。本发明基于对文语同步实际应用需求提出的文语同步记录方法及其装置,能够在录制现场准确地将文字输入和录制的语音的时间对应关系实时记录下来,使得使用者不论是事后记录录音内容,还是整理现场记录和校对文字都非常方便和准确。

Description

一种文语同步记录方法及其装置
技术领域
本发明涉及文语同步记录技术,特别是涉及一种文语同步记录方法及其装置。
背景技术
无论是在新闻采访、网络直播,还是重要会议的现场,都需要专职人员录制当时的发言,然后将其内容整理成文字。目前,这种工作主要是首先通过录音机、录音笔等语音录制设备记录当时发言,然后由打字员边听录音,边将文字记录下来。也可以采用现场速记的方式,用手写速记或者计算机、电脑速录机等辅助设备同步记录,经过整理后也可以提交文字稿。
但是上述两种方法都有一定的缺陷,它们都无法提供语音与文稿/文字之间的精确对应关系,使得验证和校对文字记录非常困难。
发明内容
本发明所要解决的技术问题在于提供一种文语同步记录方法及其装置,用于解决现有技术语音与文字之间的对应关系不精确的问题。
为了实现上述目的,本发明提供了一种文语同步记录装置,包括文字处理单元、语音处理单元,其特征在于,还包括:一同步处理单元,连接所述文字处理单元、所述语音处理单元,用于接收由所述文字处理单元输出的文字、键盘输入信息和在同一时间接收由所述语音处理单元输出的声音信号信息,并对所述文字、键盘输入信息和所述声音信号信息进行同步组合处理,生成同步记录。
所述的文语同步记录装置,其中,还包括一存贮单元,连接所述同步处理单元,用于存贮所述声音信号信息和所述同步记录。
所述的文语同步记录装置,其中,所述同步处理单元通过一声音输出接口输出所述声音信号信息,和/或通过一输出接口输出所述声音信号信息和所述同步记录。
所述的文语同步记录装置,其中,所述同步处理单元通过将所述声音信号信息切分为一设定长度的帧结构,再将所述时间和文字、键盘输入信息加入所述帧结构,组合成一记录格式,从而实现同步组合处理。
所述的文语同步记录装置,其中,所述同步处理单元通过将所述文字、键盘输入与所述时间存放在一第一线性结构,将所述声音信号信息存放在一第二线性结构,生成一对所述声音信号信息的索引记录格式,从而实现同步组合处理。
为了实现上述目的,本发明还提供了一种文语同步记录方法,其特征在于,包括如下步骤:
步骤61,同步处理单元接收由文字处理单元输出的文字、键盘输入信息和在同一时间由语音处理单元输出的声音信号信息;
步骤62,同步处理单元对所述文字、键盘输入信息和所述声音信号信息进行同步组合处理,生成同步记录。
所述的文语同步记录方法,其中,所述步骤62中,还包括通过一存贮单元存贮所述声音信号信息和所述同步记录的步骤。
所述的文语同步记录方法,其中,所述步骤62中,还包括通过一声音输出接口输出所述声音信号信息,和/或通过一输出接口输出所述声音信号信息和所述同步记录的步骤。
所述的文语同步记录方法,其中,所述步骤62中,进行同步组合处理的具体步骤为:将所述声音信号信息切分为一设定长度的帧结构,再将所述时间和文字、键盘输入信息加入所述帧结构,组合成一记录格式,从而实现同步组合处理。
所述的文语同步记录方法,其中,所述步骤62中,进行同步组合处理的具体步骤为:将所述文字、键盘输入与所述时间存放在一第一线性结构,将所述声音信号信息存放在一第二线性结构,生成一对所述声音信号信息的索引记录格式,从而实现同步组合处理。
本发明基于对文语同步实际应用需求提出的文语同步记录方法及其装置,能够在录制现场准确地将文字输入和录制的语音的时间对应关系实时记录下来,使得使用者不论是事后记录录音内容,还是整理现场记录和校对文字都非常方便和准确。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为本发明文语同步记录装置示意图;
图2为本发明进行同步处理的原理图;
图3为本发明进行同步处理的另一原理图;
图4为本发明与图2对应的同步处理流程图;
图5为本发明与图3对应的同步处理流程图。
具体实施方式
请参阅图1所示,为本发明文语同步记录装置示意图;该装置包括:文字输入接收接口1、声音输入接收接口2、文字处理单元3、同步处理单元4、语音处理单元5、存贮单元6、输出接口7、声音输出接口8。下面描述本发明装置的工作原理。
文字输入接收接口1,用于接收输入的文字和键盘输入信息,该接口可以为:USB(Universal Serial Bus,通用串行总线)、RS232、RS485、并口、PS/2键盘口、CAN(Controller Area Network,控制器局域网络)总线、网络、调制解调器,或者其它可以接收键盘和文字输入的接口类型。该接口可以存在多个,并且可以同时接收文字输入。
声音输入接收接口2,用于接收输入的声音信号,该接口可以为:麦克风接口、Line-in(线性输入)接口、AUX(辅助口)或者其它可以接收语音输入的接口类型。该接口可以存在多个,并且可以同时接收声音信号输入。
文字处理单元3,用于接收从文字输入接收接口1输入的文字和键盘输入。该单元将该输入转换为特定的文字或记录后向同步处理单元4输出,也可以对输出不作处理,直接输出至同步处理单元4。
同步处理单元4,用于接收并处理文字处理单元3的输出信息和语音处理单元5的输出信息,其包含有声音信号和相应的文字和键盘输入。该单元记录接收到输入的时间,并将在同一时间接收到的声音信号和文字、键盘输入进行同步组合,形成同步记录,并向其它单元和/或接口输出。该单元进行同步组合处理生成同步记录采用以下两种方式之一:
A、将文字、键盘输入与同时接收的声音信号组合成一个新的记录格式并输出;
B、在文字、键盘输入中记录下时间,并分别输出声音信号和文字、键盘输入。这样就生成了一个对声音信号的索引记录格式,通过该索引记录格式,声音信号与文字、键盘输入之间就形成了一一对应关系。
语音处理单元5,用于接收从声音输入接收接口2输入的声音信号。该单元包含必要的声音信号处理机制,将输入的声音模拟信号转换为相应的数字信号,并将其输出至同步处理单元4。
存贮单元6,用于存储声音信号和同步记录,该单元可以为:Flash(闪存)、SRAM(Static Random Access Memory,静态随机存储器)、硬盘、光盘等大容量存贮设备。用户可以通过接口7或/和接口8,将已经存贮在该单元中的声音信号和同步记录导出至计算机或其他辅助设备。
输出接口7,用于输出声音信号和/或同步记录,可以为计算机外设常用的接口类型,类型包括:USB、RS232、RS485、并口、CAN总线、网络、调制解调器等。
声音输出接口8,用于听取已经记录下的声音信号;可以为常用的接口类型,类型包括:耳机输出、Line-out(线性输出)接口等可以输出声音信号的接口类型。
同步处理单元4输出的同步记录和声音信号可以全部保存在存贮单元6中存储,也可以将所有或部分数据和信号通过输出接口7,同时向其它设备(如计算机)输出。另外,输出的声音信号也可以同时向声音输出接口8输出。
同步处理单元4可以在具有一定计算能力和较强I/O(Input/Output,输入/输出)处理能力的单片机芯片或其它嵌入式系统芯片,如,8051、430、ARM7、ARM9等芯片上编制软件实现;也可以将PC(Personal Computer,个人计算机)机连入系统,利用PC机完备的I/O处理和强大的计算能力,通过编写软件实现语音与文字之间的精确对应关系。
请参阅图2所示,为本发明进行同步处理的原理图。结合图1,同步处理单元4在进行同步处理时,将文字、键盘输入与同时接收的声音信号组合成一个新的记录格式并输出。
图2中,当记录到的时间为“时间1”时,此时,同步处理单元4接收在该“时间1”时输入的声音信号和文字、键盘输入“ABC”,并将该声音信号与“ABC”进行同步组合处理,生成一个新的记录格式20进行输出,该记录格式记录的信息包括“时间1”、声音信号及文字、键盘输入“ABC”。
请参阅图3所示,为本发明进行同步处理的另一原理图。结合图1,同步处理单元4在进行同步处理时,在文字、键盘输入中记录下时间,并分别输出声音信号和同步记录,该同步记录为含有时间标记的文字、键盘输入。这样就生成了一个对声音信号的索引记录格式,通过该索引记录格式,声音信号与文字、键盘输入之间就形成了一一对应关系。
图3中,当记录到的时间为“时间1”时,此时,同步处理单元4接收在该“时间1”时输入的声音信号301和文字、键盘输入“ABC”,并将该声音信号与文字、键盘输入“ABC”进行同步组合处理,同时在文字、键盘输入“ABC”中记录有“时间1”;同步处理单元4进行处理后分别输出声音信号301、带有“时间1”的文字、键盘输入“ABC”302。因声音信号301是在该“时间1”时输入的,故,声音信号301与该“时间1”之间有一对应关系,因文字、键盘输入“ABC”中记录有该“时间1”,故,文字、键盘输入“ABC”与该“时间1”之间也存在对应关系,根据上述对应关系可以生成一个对声音信号301的索引记录格式,通过该索引记录格式,声音信号301与文字、键盘输入“ABC”之间就形成了一一对应关系。
请参阅图4所示,为本发明与图2对应的同步处理流程图。结合图1、2所示,该流程包括如下步骤:
步骤401、首先同步处理单元4判断是否有录音信号,若有,则步骤继续,若没有,则继续判断是否有录音信号;
步骤402、按照采样频率将语音信号切分为定长的帧结构/语言帧;
步骤403、获取/取得当前时间,并将该时间加入帧结构;
步骤404、进一步判断在该时间有没有文字、键盘输入,若有,则步骤继续,若没有,则转步骤406执行;
步骤405、将文字、键盘输入加入帧结构;
步骤406、将语音帧/帧结构作为同步记录保存在存贮单元6中。
请参阅图5所示,为本发明与图3对应的同步处理流程图。结合图1、3所示,该流程包括如下步骤:
步骤501、首先同步处理单元4判断是否有录音信号,若有,则步骤继续,若没有,则继续判断是否有录音信号;
步骤502、进一步判断有没有文字、键盘输入,若有,则步骤继续,若没有,则转步骤504执行;
步骤503、获取/取得当前时间,将文字、键盘输入与该当前时间混合为同一记录,也即是,将文字、键盘输入与该当前时间存放在第一线性结构中,再将其作为同步记录保存在存贮单元6中;
步骤504、将存放在第二线性结构中的语音信号也保存在存贮单元6中。
下面进一步描述图4、图5所示的两种同步处理方法是如何处理某一特定时刻的文字和语音输入:
同步处理单元4在开始运行后不间断地从语音处理单元5得到语音信号,当第1500毫秒时,从文字处理单元3接收到文字输入信号“今天”,那么对应图4、图5中两种同步处理的流程和处理方法,同步处理单元4相应地生成两种不同记录格式的同步记录:
格式:将语音信号按照每1000毫秒一帧进行分割,当采样频率为11025Hz,8bits时,每帧数据长度设定为“11025字节+时间描述+文字描述”。为方便定位,将时间描述和文字描述设为定长,分别设为32字节,并放置在语音数据之前。这样在第2个数据帧的前32个字节中,将保存“1500”的整数表示,其随后的32个字节将保存汉字“今天”的区位码。剩余的11025字节为声音/语音数据。
格式二:声音/语音信号将单独保存在一个线性数据结构中,无需再作处理。时间数据“1500”和文字描述“今天”保存在另外的线性结构中。只要通过时间数据以及语音信号的采样频率,系统就可以很容易将文字“今天”定位到语音数据的某一特定位置。
本发明提供的文语同步记录装置可以单独独立工作,也可以与计算机相连接,作为计算机辅助外设的硬件设备。同时,该装置也可以根据本发明所述同步记录原理,完全或部分由软件实现本发明。
基于实际应用,本发明提出的文语同步记录方法及其装置,能够在录制现场准确地将文字输入和录制的语音的时间对应关系实时记录下来,使得使用者不论是事后记录录音内容,还是整理现场记录和校对文字都非常方便和准确。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1、一种文语同步记录装置,包括文字处理单元、语音处理单元,其特征在于,还包括:一同步处理单元,连接所述文字处理单元、所述语音处理单元,用于接收由所述文字处理单元输出的文字、键盘输入信息和在同一时间接收由所述语音处理单元输出的声音信号信息,并对所述文字、键盘输入信息和所述声音信号信息进行同步组合处理,生成同步记录。
2、根据权利要求1所述的文语同步记录装置,其特征在于,还包括一存贮单元,连接所述同步处理单元,用于存贮所述声音信号信息和所述同步记录。
3、根据权利要求1所述的文语同步记录装置,其特征在于,所述同步处理单元通过一声音输出接口输出所述声音信号信息,和/或通过一输出接口输出所述声音信号信息和所述同步记录。
4、根据权利要求1、2或3所述的文语同步记录装置,其特征在于,所述同步处理单元通过将所述声音信号信息切分为一设定长度的帧结构,再将所述时间和文字、键盘输入信息加入所述帧结构,组合成一记录格式,从而实现同步组合处理。
5、根据权利要求1、2或3所述的文语同步记录装置,其特征在于,所述同步处理单元通过将所述文字、键盘输入与所述时间存放在一第一线性结构,将所述声音信号信息存放在一第二线性结构,生成一对所述声音信号信息的索引记录格式,从而实现同步组合处理。
6、一种文语同步记录方法,其特征在于,包括如下步骤:
步骤61,同步处理单元接收由文字处理单元输出的文字、键盘输入信息和在同一时间由语音处理单元输出的声音信号信息;
步骤62,同步处理单元对所述文字、键盘输入信息和所述声音信号信息进行同步组合处理,生成同步记录。
7、根据权利要求6所述的文语同步记录方法,其特征在于,所述步骤62中,还包括通过一存贮单元存贮所述声音信号信息和所述同步记录的步骤。
8、根据权利要求6所述的文语同步记录方法,其特征在于,所述步骤62中,还包括通过一声音输出接口输出所述声音信号信息,和/或通过一输出接口输出所述声音信号信息和所述同步记录的步骤。
9、根据权利要求6、7或8所述的文语同步记录方法,其特征在于,所述步骤62中,进行同步组合处理的具体步骤为:将所述声音信号信息切分为一设定长度的帧结构,再将所述时间和文字、键盘输入信息加入所述帧结构,组合成一记录格式,从而实现同步组合处理。
10、根据权利要求6、7或8所述的文语同步记录方法,其特征在于,所述步骤62中,进行同步组合处理的具体步骤为:将所述文字、键盘输入与所述时间存放在一第一线性结构,将所述声音信号信息存放在一第二线性结构,生成一对所述声音信号信息的索引记录格式,从而实现同步组合处理。
CNB2006100114328A 2006-03-03 2006-03-03 一种文语同步记录方法及其装置 Expired - Fee Related CN100483332C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100114328A CN100483332C (zh) 2006-03-03 2006-03-03 一种文语同步记录方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100114328A CN100483332C (zh) 2006-03-03 2006-03-03 一种文语同步记录方法及其装置

Publications (2)

Publication Number Publication Date
CN101030129A true CN101030129A (zh) 2007-09-05
CN100483332C CN100483332C (zh) 2009-04-29

Family

ID=38715504

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100114328A Expired - Fee Related CN100483332C (zh) 2006-03-03 2006-03-03 一种文语同步记录方法及其装置

Country Status (1)

Country Link
CN (1) CN100483332C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541504A (zh) * 2011-01-04 2012-07-04 鸿富锦精密工业(深圳)有限公司 语音文字转换装置及方法
CN108269205A (zh) * 2018-01-24 2018-07-10 成都安信思远信息技术有限公司 一种利用云平台的电子数据鉴定系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541504A (zh) * 2011-01-04 2012-07-04 鸿富锦精密工业(深圳)有限公司 语音文字转换装置及方法
CN108269205A (zh) * 2018-01-24 2018-07-10 成都安信思远信息技术有限公司 一种利用云平台的电子数据鉴定系统

Also Published As

Publication number Publication date
CN100483332C (zh) 2009-04-29

Similar Documents

Publication Publication Date Title
CN103414949B (zh) 一种基于智能电视的多媒体编辑系统与方法
CN101174448B (zh) 有声图片播放方法、装置和有声图片索引文件生成方法
CN103324513B (zh) 程序注释方法和装置
CN1741583A (zh) 用于协调视频与字幕的同步的设备和方法
JP2010078979A (ja) 音声録音装置、録音音声検索方法及びプログラム
CN1212601C (zh) 一种嵌入式语音合成方法及系统
BRPI0415045A (pt) mìdia de armazenamento de informações para armazenamento de dados de multimìdia, mìdia de armazenamento de informações, aparelho de processamento de legendas de texto, método de processamento de legendas de texto, e mìdia de gravação passìvel de leitura em computador
CN1929655A (zh) 一种可实现文本与语音转换的手机
CN1945692A (zh) 一种在语音合成系统中提升提示音匹配效果的智能方法
WO2023287360A3 (zh) 多媒体处理方法、装置、电子设备及存储介质
CN101030129A (zh) 一种文语同步记录方法及其装置
CN1901082A (zh) 音频记录装置、音频记录方法和音频记录程序
CN1875400A (zh) 信息处理设备、信息处理方法和记录介质、以及程序
CN101448094B (zh) 一种用于快速导入媒体素材的方法
CN1710977A (zh) 一种简便的彩信提取及保存的设备和方法
CN1529264A (zh) 通过文字块位置编码查找相关联多媒体内容的方法
CN1504920A (zh) 多媒体文件的数据结构、文件配送装置及其方法和程序
CN1818899A (zh) Mpeg播放器的数据检索方法
CN213483396U (zh) 一种基于多语种的音频语种识别分类转接装置
CN204760038U (zh) 具有录音和文本记录功能的录音笔
CN101035154A (zh) 盲用便携式电子通讯录
CN103531224A (zh) 应用于嵌入式系统平台的简易语音播放方法
CN1371090A (zh) 一种将语音文件转换成文本文件的方法
CN101980198B (zh) 一种实现k歌随身带的方法
CN101079045A (zh) 多视窗档案播放系统、多视窗档案编辑系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090429

Termination date: 20120303