Logo
Published on

☆~世界を超えるまで!~☆ BLACK★ROCK SHOOTER Lora训练日记(二)

☆~世界を超えるまで!~☆ BLACK★ROCK SHOOTER Lora训练日记(二)

Authors

Authors
  • avatar
    Name
    Astar
    Twitter
    @bilibili
    黑岩10年老粉,没有技术力,只有眼泪。

每一次都有的 致谢

感谢全世界创作过黑岩的艺术家,尤其感谢Huke大神的创作这个角色

最近开始研究如何训练Lora,感谢各位技术大佬,以下是自接触过Lora训练以来参照过的教程,在此一一列出:

训练模型的代码来自秋葉aaak佬,感谢

最新结果:

C站:https://civitai.com/models/21358/blackrockshooterlora

示例:

比较懒惰,找到了一个好的词条就一直用了

Prompt: 1girl, black rock shooter (character),disorder, star, dilapidated scene, dilapidated , looking at viewer, glowing,twintails,

Negative prompt: worst quality, low quality, malformed hands,poorly drawn hand,mutated fingers,extra limbs,poorly drawn face, monochrome, zombie,word,

以下是结果:

Stable Diffusion Model:CetusMix 训练的底模

data10

data10

data10

data10

Stable Diffusion Model:9527_v10.ckpt 这个模型跑出来的图很像初音

data10

data10

data10

Stable Diffusion Model:meinamix_meinaV7.safetensors 有些纯真?

data10

data10

data10

Stable Diffusion Model:dalcefoV3Anime_dalcefoV3Anime

data10

data10

data10

电脑配置:

配置如下:

处理器:15 vCPU Intel(R) Xeon(R) Platinum 8358P CPU @ 2.60GHz

内存:80.0 GB

显卡:NVIDIA GeForce RTX 3090 显存35GB

操作系统:Linux

python环境:anaconda,其中:

python:3.10.8

torch: 1.12.1+cu116

流程总结以及问题记录

依然对数据集进行处理,没办法目前只会对数据集处理

1. 对数据集进行了扩充共,计186张图片,然后将其分成三个文件夹存放。,依然给每张图片添加特写,但是训练过程中发现Lora就爱画腿,于是大幅减少腿的特写

data10

  • 4_black_rock_shooter:该文件夹中的数据画风接近p站原作者

  • 4 _changecloth:其他画风

  • 4_other:其他角色

2. 调整Tag,删掉了黑岩一些外形相关的Tag,比如说双马尾,黑色外套,蓝色眼睛,眼睛冒火等

4. 调整训练参数,训练图像大小设置为640*768,noise_offset设定为0.1,使用 Lion 优化器,减少学习率,开启persistent_data_loader_workers(感觉没加速多少,估计是数据量少吧)

5. 训练,底模测试了几个,还是感觉 CetusMix 好,下次再试试其他底模看看

结果

都放在上面了,有爱自取

总结

就个人而言,这次跑出的图的质量还是有所进步的,另外模型的泛化性也好了点,试了其他几个底模效果有的好有的不好。

还是没搞懂正则化,因此先没用。

对Tag进行处理确实比较重要,删掉Tag意味着让训练出来的Lora学会这个Tag表示的特征,比如说我删除了 flaming eye ,那么大部分画出来的图都会画出黑岩左眼冒出的蓝色火焰。

可以用其他模型搭配本Lora跑图,有的效果好有的效果差,总归还是训练的底模能抛出更多人物细节。