/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
//
/中文/
/中文/
字幕大师OKVoice是一款非常专业的高准确率语音识别技术的字幕制作软件,能够将视频的中的对话自动识别转换为文字并且生成字幕,并拥有自动对齐、批量上传、断点续传三个特点,能够提升后期工作人员的效率。
目前,市面上大部分视频字幕制作软件仍依赖于人工手动编辑,使用起来非常耗时麻烦。OKVoice根据大量数据分析,发现了字幕制作软件的缺陷与字幕工作者的需求,结合其自身在智能语音技术方面的多年积累,经过一年多不断的努力,研发出依托于语音识别技术的字幕制作工具——“字幕大师”。
据了解, “字幕大师”创新运用OKVoice自主研发的语音识别技术,将视频中的声音自动识别为文字,自动将声频文字匹配为时间轴(对齐声音和文字),生成字幕文件,整个制作过程减少了90%以上的人工干预,对齐准确率超过93%。
“字幕大师”作为OKVoice推出的首款2C产品,颠覆了普通字幕软件的基本操作流程。此次开放的自动对齐功能只需导入音频与文本就即可自动生成时间轴,可节省3~5倍的时间,并具有“支持断点续传、支持批量上传、文本自动对齐”三个特点,改变了以往“手拍字幕”的繁琐,更加省时高效。
1、全新界面,底层优化
2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作
“自动对齐”是指将用户上传的 txt 文件中的文字内容,通过语音识别技术,逐句和音视频人声内容相匹配,并为每一句话添加合适的起止时间。有时也称为“自动对轴”或“自动切轴”。
用户在使用该功能时,需要提前准备好音视频文件和与其对应的 txt 文件。并注意:
① txt 文本中的文字内容需不多于音视频文件中的人声内容;
② 音视频文件不应有过于嘈杂的声音或音乐,否则将影响到对齐效果。
③ 自动对齐效果视音质与口音而定,并不一定百分百贴合。建议用户在完成对齐后校
对一遍,对不满意的地方进行调整。
l 语音识别
“语音识别”是指将用户上传的音视频文件,通过语音识别技术,每一字每一句地识别出来,并“自动对齐”,给出每句话的起止时间和说话内容。与“自动对齐”功能相比,用户无需提前准备 txt 文件。但是,“语音识别”功能对音质和口音的要求也更高。如上传的音质比较嘈杂、方言口音严重或环境音、回声、现场声音比较大,则不适合使用“语音识别”功能。
l 保存工程
工程文件,又称项目文件,它并不是用户最终所需要的文件。字幕大师的工程文件后缀为 okpro,只能在字幕大师中打开(“媒体”界面左上角“打开工程”)。它存储的内容是该工程下的素材地址和编辑信息,但并不包含素材本身。所以在移动工程文件时必须要把素材也一起保存放置到其他设备上才可以正常使用,否则打开工程文件会因素材丢失而报错。
用户一般在任务处理到一半需要中途离开时可以选择“保存工程”,这样下次再打开工程文件就可以从中断的地方继续操作。
l 导出字幕
“导出字幕”,导出的是独立存在的外挂字幕文件,文件格式选项包括: srt、ass、vtt 和 lrc。如果不需要时间点信息,也可以导出为纯文本文件 txt 格式。以上格式均可以用“记事本”方式打开查看内容。
我们建议用户在“自动对齐”或“语音识别”结束后导出保存字幕文件。这样,一旦需要修改或重新压制,只需要调出字幕文件,不需要从识别开始重新做起。我们建议用户在保存字幕时首选 srt 格式。字幕大师对 srt 格式的支持度更高,可以再次导入进行编辑,也可以再次保存为其他格式的字幕文件。(如第一次保存为非 srt 格式的文件,有可能无法再次导入字幕大师进行二次编辑。)