ai文字语音播报:免费自动AI语音识别制作字幕
ai文字语音播报:免费自动AI语音识别制作字幕并且找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。控制台→左上角三横图标(产品与服务)→访问控制(RAM)→2-3次的确认立即开通→管理控制台→人员管理-用户→创建用户(任意自定义名称)-(√)编程访问→开通请开通设置前,先自行注册阿里云账号,并完成账号的(个人/企业)实名认证。大体流程是“创建用户”→“设置用户权限”→记录”用户ID“ ”Secret密钥“。按照以下的辅助箭头信息的流程开通“访问控制”即可。
大家好我是啊忠略懂点,欢迎来到我的宝藏频道,我主要分享各种省钱避坑,跨境技术和自媒体转化工具的知识内容,如果感兴趣的欢迎订阅我的频道,看看不一样的赛道。
AI语音识别是很大的应用场景,而针对我们个人的立场出发,又有自媒体从业者 相关论文科研报表 电子商务语音协助 开发翻译产品 语音控制应用 语音输入方向的应用衍生,如果您对这方面感兴趣或者是其中的从业者,建议看完这次的内容,可以一劳永逸的免费解决问题。
软件名称:VideoSRT语雀 0.3.3 免费语音识别 字幕制作
是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。
适用于快速、批量地为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
我们一共需要开通设置三个服务,分别是“访问控制”、“对象存储OSS”、“智能语音交互”。
请开通设置前,先自行注册阿里云账号,并完成账号的(个人/企业)实名认证。
那么首先开通并设置“访问控制”。大体流程是“创建用户”→“设置用户权限”→记录”用户ID“ ”Secret密钥“。
按照以下的辅助箭头信息的流程开通“访问控制”即可。
控制台→左上角三横图标(产品与服务)→访问控制(RAM)
→2-3次的确认立即开通→管理控制台→人员管理-用户
→创建用户(任意自定义名称)-(√)编程访问→开通
并且找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。
AccessKey ID :【访问控制ID】
******************
AccessKey Secret :【访问控制密码】
******************
然后回到用户界面,针对创建好的用户,最右边有“添加权限”
点击“添加权限”→增加“对象存储OSS”、“智能语音交互2.0” 这两项服务的权限,
让该服务可以在后续的使用过程中,可以管理控制这两项服务的正常工作。
对象存储OSS该服务,个人用户每天使用2小时语音的情况下免费,超出部分存储费用-数据存储(本地冗余存储)-0.12元/GB/月。
所以软件使用的过程中,会临时的把处理的音频文件上传到这个存储空间,所以就需要看自身使用情况,在该服务的文件管理内,定期的对临时文件进行删除操作,避免出现太多的存储费用。
删除的流程是:对象存储OSS→Bucket 列表→Bucket 名称
→文件管理→(√)全选→批量操作→进行删除。
按照以下的辅助箭头信息的流程开通“对象存储”即可。
控制台→左上角三横图标(产品与服务)→对象存储OSS
→2-3次的确认立即开通→管理控制台
→创建Bucket(任意自定义名称)、
区域选择就近原则、读写权限设置为“公共读”、其他默认
→选择确定(创建)
之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。
BucketName【对象存储的名称】
******************
↓“外网访问”↓
Endpoint【对象存储的地域节点】
******************
BucketDomain【对象存储的Bucket域名】
******************
按照以下的辅助箭头信息的流程开通“智能语音交互”即可。
控制台→左上角三横图标(产品与服务)→智能语音交互
→开通→录音文件识别(试用)-每天两小时免费识别时间
(√)协议→立即开通
按照以下的辅助箭头信息的流程配置“智能语音交互”即可。
管理控制台→全部项目→创建项目→语音识别 语音合成
→任意自定义名称→确定→基于场景选择模型
→非电话-[中文普通话(识音石V1-端到端模型)][识别输入项]
→确认使用→自定义选择语音合成模型[输出项]→确认使用
之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。
Appkey:【智能语音交互的Appkey】
******************
打开软件界面,按照下面的流程操作,并且把相匹配的信息,复制黏贴进输入框内,并保存。
名称别名:任意自定义名称【1软件显示名称,与阿里云无关】
【2 智能语音交互的Appkey】
【3 访问控制ID】
【4 访问控制Secret】
【1 对象存储的地域节点】
【2 访问控制ID】
【3 访问控制密码】
【4 对象存储的名称】
【5 对象存储的Bucket域名】
文件输出目录:自定义设置文件夹路径
至此,后续就可以打开(拖动)媒体文件,正常自动AI识别字幕啦!
备注:翻译功能不建议使用,因为涉及翻译过都会有后词不达意的问题,还是有必要先利用翻译系统,逐一校对中文内容的准确性,再合成内容,这样才是错误率最低的方案。毕竟对自己内容负责,是每个自媒体人的基本技能。
好了,以上就是本期的所有内容。
希望我分享的能给大家带来帮助,也别忘记点赞关注订阅分享转发,我们下次再见,啊忠感谢了。