Responsive image

徒悲叹 - 2024-04-16 11:08 [GF]
体验了下 有些句子效果很好 有些又很差 同一次输入的两行相同的文段都能得到两种截然不同的语气和语速 原本是打算拿套路直播上的红绿灯用whisper转为文本 然后找个足交视频搭配音效来着 但是四句里面就有一两句用不了很尴尬,,,总不能一句一句剪切在一起吧


徒悲叹 - 2024-04-16 11:09 [B1F]
顺便问问大家 做ai语音的文本一般怎么来的啊 小说或者claude扮演一般都有旁白 还不是单纯的对话


徒悲叹 - 2024-04-16 12:45 [B2F]
顶一下


梼杌 - 2024-04-16 15:16 [B3F]
一般来说如果你想得到稳定的情感倾向或者语气倾向,你的训练素材就得专门找相关的材料,比方说愤怒的,高兴的,舒缓的,而且本地部署的小模型上限是挺容易摸到的。所以如果有更高的要求估计也比较难满足


1c3d19a6 - 2024-04-16 20:47 [B4F]
gpt sovits就是有随机幸运的,要抽卡,还真就是只能一句一句剪,不怕棒读的话你可以用bert vits






桌面版


Powered by SP Project v1.0 © 2010-2019
Time 0.000901 second(s),query:3 Gzip enabled


Top