无图版
帮助
论坛首页
登录
注册
讨论区
搜索
社区服务
屏蔽配置
刷新黑名单
好奇模式
清空列表
管理列表
■
帖子 |
■
头像
社区论坛任务
用户名
UID
Email
认证码
点此显示验证码
热门版块:
茶馆
询问&求物
免空资源区
同人音声
网赚资源区
实用动画
Soulplus
Wind
用户中心首页
编辑个人资料
查看个人资料
好友列表
用户权限查看
积分管理
积分转换
特殊组购买
收藏夹
我的主题
基本统计信息
到访IP统计
管理团队
管理统计
在线统计
会员排行
版块排行
帖子排行
个人首页
我的收藏
好友近况
南+ South Plus
AI交流 (beta)
sovits的一些疑惑
漫区特设
Comic Market 103
Comic Market 102
サンクリ
Comic1☆
其他同人志
一般漫画
例大祭&紅楼夢
汉化本发布
旧物仓库
蜜柑计划
- 蜜柑计划 - Mikan Project
综合交流
ACG交流
轻小说
原创绘画
原创小说区
询问&求物
茶馆
AI交流 (beta)
免空资源区
网赚资源区
人民囧府
事务受理
上一主题
下一主题
新 帖
|
浏览器收藏
|
打印
荀彧
作者资料
发送短消息
加为好友
UID:
1253165
精华:
0
发帖:
96
HP:
0 点
SP币:
1288 G
昵称: 荀彧
在线时间: 257(小时)
注册时间:
2019-12-27
最后登录:
2024-05-21
GF
2024-03-16 09:29
(祥瑞御免)
只看GF
|
屏蔽
屏蔽此人
屏蔽头像
|
小
中
大
sovits的一些疑惑
目前版本4.1,家用1660s速度太慢,用云端训练的。想问一下loss值真的不重要吗?目前自己从抠的数据集,大概70多分钟,裁剪5-15s,训练的时候loss总在30和40之间,训练三四万步,最好的也才29左右- -,config设置的学习率0.0001,bs 12。试推理的时候带上了浅扩散和聚类模型,出来的音频感觉还是有点怪怪的,是原始数据集不够好吗?数据集没有歌声文件,基本都是说话的干声,AU去除了大部分呼吸声以及匹配了响度QAQ,有大佬解答一下吗
顶端
回复
引用
分享
Mni
作者资料
发送短消息
加为好友
UID:
1422160
精华:
0
发帖:
122
HP:
0 点
SP币:
3247 G
昵称: Mni
在线时间: 259(小时)
注册时间:
2021-07-01
最后登录:
2024-05-21
B1F
2024-03-16 09:51
(快乐炼丹人)
只看该作者
|
屏蔽
屏蔽此人
屏蔽头像
|
小
中
大
数据集的质量是最重要的 loss数值当然也重要 根据loss值能看出ai学得怎么样了 可以找一下相关训练的视频 看一下他们的loss值在多少
顶端
回复
引用
分享
荀彧
作者资料
发送短消息
加为好友
UID:
1253165
精华:
0
发帖:
96
HP:
0 点
SP币:
1288 G
昵称: 荀彧
在线时间: 257(小时)
注册时间:
2019-12-27
最后登录:
2024-05-21
B2F
2024-03-17 04:43
(祥瑞御免)
只看该作者
|
屏蔽
屏蔽此人
屏蔽头像
|
小
中
大
回 1楼(Mni) 的帖子
看了一下,loss值有影响但还是得综合看fm,mel和kr值,目前的15w的step的部分效果没有11w左右的好,同一首干声会有哑音,据说还得看数据集,我的才360m
顶端
回复
引用
分享
上一主题
下一主题
南+ South Plus
AI交流 (beta)
[-- 查看移动版 --]