JasonWen's picture
Update README.md
4d88b27
|
raw
history blame
22.4 kB
---
language:
- zh
license: cc-by-nc-sa-4.0
tags:
- stable-diffusion
- stable-diffusion-diffusers
- text-to-image
- diffusers
inference: true
---
---
# AI兽人魔法书全目录——从入门到精通
(四月初更新修订)
时间来到2023年4月,距离SD发布也已经大半年了,在这半年间各种AI绘画的算法、模型、工具、平台如雨后春笋般出现,那么我们要使用AI生成furry兽人图像,有哪些选择呢?都需要怎么做呢?有什么好看的咒语呢?我写了一系列文章来回答这些问题(链接在最后)。
## 0基础入门篇(必读!!!)
<details>
<summary>0基础入门篇(点击展开)</summary>
### 一、纯纯的入门介绍(必读)
总的来说,能画furry的AI有三个大类,一个是由开源的**stable diffusion框架二次开发**出来的数不胜数的模型,一个是**Midjourney和它的变种niji·journey**,还有一个是和ChatGPT师出同门的**Dall·E2和微软版本的Bing Image Creator**。分别简略介绍一下。
AI绘画的进步发生在22年,diffusion算法的相比于之前的GAN算法有了翻天覆地的性能提升,之后框架模型都吸纳了diffusion算法。于是4月OpenAI发布Dall·E2,5月Midjourney内测,7月stable diffusion开源。
22年暑假stable diffusion框架开源(stable diffusion在下文简称SD),由两个公司开发公布,由于开源免费高度自定义迅速占领市场,随后基于SD魔改的模型井喷式爆发。
SD实际上分为两部分SD的框架和模型:常见的框架GUI有**WebUI**、naifu和ComfyUI三种,前种都有数不胜数的魔改版和整合包,框架是各种环境、命令、功能、算法的集合;模型则是指的checkpoint或SafeTensor文件(也包括配套的vae等),是存储绘画的实际内容的地方,不同的模型可以画不同的内容。对于自己配置或本地的SD,一个模型可以在不同的框架下运行,一个框架也可以运行多个模型。原版SD由两个公司分别免费开源公布出WebUI和原版SD模型(原版模型不能画furry)。
SD有一个魔改版是NovelAI公司推出的,这个公司本来是研究写小说的AI的,看到绘画赚钱也来分一杯羹,拿着别人免费开源的SD开发出自己的版本。他们开发出了naifu框架和自己的furry模型(兽人控的钱真好赚)。他们早期版本**animefull模型和naifu框架**(22年十月初)“被黑客”泄露出来,效果还不错,于是有些人就开始花钱直接到他们官网上使用他们的服务。**注意!很多人不能区分animefull等模型和naifu框架,都管他们叫NovelAI,在交流上造成很大困扰!**
SD有几百种furry模型,其中分为通用的几种和他们不同的版本或epoch,还有上百款针对单个furry角色定制的模型。
SD开源,自己配置麻烦,门槛高,下限低上限高,想要什么模型都可以自己炼,没有任何限制。**炼!都可以炼!**
现阶段除了MJ和它的变体niji以外,几乎市面上所有的全部都是SD,所有你能搜到的小程序、软件都是包装好的魔改的SD,这些大多数都是不能画furry的(加载animefull或者anything和基于any融合的或许可以,但是效果不一定好)。
还有的就是Midjourney的变种niji·journey了,Midjourney(简称MJ)是22年5月发布,主打写实和艺术绘画,随后waifu diffusion的开发团队加入进来合作开发了niji·journey(下文简称niji)。niji主打二次元AI绘画,也可以画furry,且上手简单不用配置,普遍效果好。MJ在v4之前的版本都很难画furry,v4可以画写实的兽人,v5除了写实兽人以外还可以画一些美漫风格的二次元福瑞。niji和MJ唯二缺点是要花钱和不能画涩图。
另外我们前面说的**Dall·E2**也是可以完美画福瑞的,生成质量不差,只是Dall·E2的功能相比SD和MJ显得太少了,而且同样是收费,Dall·E2在OpenAI官网的服务比MJ贵多了。但是因为背靠微软金主,我们现在也能用上免费的Dall·E2了。微软在23年二月推出了基于Dall·E2的**Bing Image Creator**,它和Dall·E2的算法是一样的,只要你登陆微软账号就能无限白嫖。
总结一下,现阶段有niji/MJ、Bing Image Creator和SD上的各种模型能画furry。那他们都有什么特点呢?要怎么选择呢?
### 二、该选择哪一种工具
#### 1.根据手里的设备选择工具
先确定你手上有什么设备,所有的AI绘画都需要高性能消耗,一般都是使用**英伟达显卡**(99%)也有极少数可以使用CPU、A卡或者Mac的,但是操作复杂、速度慢、效率低不推荐使用。N卡最好20系以上、60以上的型号,最好6G显存或以上,低于这个标准一点也能用,再低比如960或者4G显存的卡就会使用得极其痛苦。cuda够用的情况下显存越大越好。
如果你有上述硬件,那就可以在**本地运行SD**,想画啥画啥,没有限制。如果没有这些,比如只有手机、平板或苹果电脑,那就看一下各种云端的服务吧。
~~先强调一下,你在手机上用别人的服务,不是说你用手机那残废的soc生成出来的!本质还是你把生成指令通过网络发送到别人的服务器上用别人的N卡生成出的图片!不要再说是手机跑出来的辣!真让人血压升高!~~
**云端服务**又可以大致分为三种,分别是**大公司的服务(niji/MJ、Dall·E2/Bing Image Creator和NovelAI)、租赁云端服务器自己配置**、小作坊小公司配置好的平台。这里只推荐前两种,后一种性价比低。
先说两种大公司的服务,单独购买每个月都要**两百到三百人民币左右(汇率问题)**,可以到群里时不时嚎一嗓子有没有拼车的,几个人一起购买会便宜一些。**NovelAI的服务是不需要魔法上网就可以访问的,界面全英,看不懂用翻译器**。而**niji/MJ是在discord频道里对机器人发送指令,访问discord要魔法上网(这里电脑端推荐steam++,手机端自己看)**。都是只要能访问、花钱氪金之后就能用,不挑本地设备是电脑还是手机。除了上述花钱购买的服务,还可以用微软的**Bing Image Creator,只需要魔法上网加登陆微软账号就可以无限白嫖**
租赁云端服务器自己配置适用于没有本地合适的硬件但是仍追求自己全部掌握的自由度,常见的有**colab(已经不能免费白嫖了)、autodl(价格低廉好用)、阿里云(秋叶的推广可以白嫖三个月)等**提供显卡算力的云平台(这几个平台都有人配置好了,方便),还有百度腾讯华为的云服务器(不太推荐)。这种方法是**你在云端配置好框架和模型,然后你通过网页访问服务器,发送命令获得图片**。其他平台的教程百度或者B站搜索。
#### 2.  根据需求选择工具
除了设备和使用方法外,也可以根据你想画什么来选择。
如果你**不打算画瑟图**,想要美术风格更加强烈的图片(一眼美或者一眼帅),且对furry的特征没有要求(不画oc和别人的设定),那首推用niji画,niji简单好用易上手,只要你用心学,**三天就能速成**,~~学不会来打我~~。这里贴一个教程,看完包会[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。除此之外还有**可以白嫖的Bing Image Creator**,很多情况下不比niji/MJ效果差,而且还能白嫖,教程[Dall·E2和Bing的AI图像生成](https://docs.qq.com/doc/DUXV5clpHT1JaZGx4)。
如果你**打算画瑟图**,或者想画的内容比较偏门,或者对furry的特征有要求(画oc和别人的设定),那就用SD,更进一步说是WebUI(naifu自由度还是太低了,comfyUI还不成熟)。SD有些模型专门绘制冷门XP(感谢制作者!),还可以深度定制修改模型,真正做到了百无禁忌,想画啥就画啥。尽管现阶段WebUI的使用已经有无数前人的经验总结,变得很简单了(比之前),但是上手还有一定成本,最主要的是大多数模型生成一眼好看的图的概率比较低,很多人上来不会写咒语就生成古神,泼几次凉水后就没兴趣了。总的来说**玩得好真是能够画所有的东西,但是想要学到高手水平不容易**
如果你**打算画瑟图**,但是也不想在本地或者云服务器折腾,就想输入咒语就出现瑟图,那只有**NovelAI官网的furry beta模型**可以选择了。**吟唱,出瑟图,氪完金一切都是那么简单**。NovelAI的模型出图质量稳定,但是画风不多(也可能是我们氪金的人太少,没多少人研究出它的全部实力)。
### 三、必要的基本知识和术语
#### 1.  基本知识和术语
AI绘画最基本的操作是文生图和图生图。顾名思义**文生图**是你输入一些描述的词语或文字,算法根据你的描述生成对应图像;**图生图**是你先提供一张参考图片,程序根据图片和你的描述文字结合来生成图片。注意,图生图的参考都不是让AI记住你的人物,然后画出人物的其他姿态和动作,更接近根据色块和构图生成(SD的图生图)或者生成给定图片的风格的图片(niji的图生图),背后原因跟diffusion算法的原理有关(记住结论就行,如果想知道深层原理看这一篇[什么是AI绘画与stable diffusion讲解](https://docs.qq.com/doc/DSWVVYnZXdmhiTlBk))。
你给程序的文字描述,用最标准的术语叫**prompt**,有时叫tag、咒语、关键词之类的大家也能听懂,只要生成图片就一定需要prompt。正面关键词是我们希望AI画出来的东西,负面关键词(negative prompt)是我们不希望AI画出来的东西。
**参数**,常见的参数有画面分辨率和影响画面质量的一系列参数,具体每个框架不一样,下面分别讲。
另外,咒语还有**语法**,语法是咒语的书写规范和特殊符号使用方法。SD的WebUI和naifu的语法看这里[SD咒语和语法(WebUI或naifu)](https://docs.qq.com/doc/DSXBkTVZrUmpLdmpC),niji和MJ看这个[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)。
对于SD框架,还可以自己加载不同的**模型**,也叫丹药。一个模型可能有多个版本,有时间上不同epoch的迭代,也有一个epoch的修剪版(降低体积,牺牲一点点质量)。模型的制作也叫炼丹。常见能画furry的模型可以分为4类:具有泛化性的**通用模型**,如animefull和anything(二次元)、fkingScifi(写实),这些主力不是用来画福瑞的,但是具有对furry的泛化性,效果也还行;**通用福瑞模型**,如furry epoch4、yiffy-e18(简称ye18,是第18个epoch)、YiffAI V2(简称YAI,还在更新);**特殊XP专用模型**,如Zack3D_Kinky(简称Z3D,也可以当通用福瑞模型用)、AnalVoreHumanFurryPony等;**特定角色专用模型**,现在已经被LoRA取代了,如阿努比斯(埃及神话)、布莱泽(艾尔登法环)、雷格西(动物狂想曲)等等你能想到的角色里面有十个甚至九个都有专属模型。注:模型大类可以参考,但是举的例子基本都是老模型了
#### 2.  SD相关
SD主流有两个框架(WebUI和naifu)和他们的不同版本,如果Windows本地使用,你需要**至少20G以上**的硬盘空间+好的显卡。
当下要使用WebUI,我只推荐**秋叶的启动器(视频教程[https://www.bilibili.com/video/BV1ne4y1V7QU](https://www.bilibili.com/video/BV1ne4y1V7QU)下载链接 https://pan.baidu.com/s/1XHOx7zgO0IQVL-01opwXjA?pwd=uvdy 更新:最新版可以直接去他的QQ频道下载,频道号是3764f45toc)**,简直不太好用好吗!原本复杂的操作直接一个启动器全部搞定!自动更新,升级回退版本,选配WebUI运行环境参数等等等等功能全部都有,傻瓜式使用!有了秋叶的启动器,WebUI再也不是一个难以上手的工具!秋叶YYDS!
WebUI常用的文生图参数有**采样步数steps、采样方法、宽高分辨率、生成轮数和每轮生成张数、CFG(prompt的整体权重)、种子seed、噪声种子**和其他相关参数。
WebUI除了基本的文生图和图生图以外还有只修改图片的一部分的**部分重绘、高清放大**等功能。除了这些,开源的WebUI还有很多插件和脚本,脚本有比如xy图(用于定性定量对比咒语的每个词或参数)、prompt热力图(每个词汇在生成的图片中负责画哪一部分)等等进阶的功能。
除此之外还有很多进阶的知识和玩法,比如WebUI的各种神奇拓展和插件的使用方法、如何定性定量研究咒语的效果等等,还有炼丹(使用各种方法定制自己的模型),看具体文章里的讲解。
**23.4更新**)进入23年SD又更新了**两个大杀器**(感谢开源社区),一个是LoRA,一个是ControlNet控制网。**LoRA**可以简单的理解为一种炼制小丹药的方法,用LoRA炼出来的模型都比较小,配合大模型能够快速调整**画风**或者**特定角色**等。**ControlNet控制网**则是实现了对画面的更直接的控制,有边缘监测、深度图、姿态检测等核心功能,能够对线稿上色、处理物体深度、按照人物姿势生成图像等,**极大的解决了之前生成图像随机抽卡导致人物肢体错位、画不好手等问题**
#### 3.  niji和MJ相关
niji和MJ现在都能画furry了,niji更偏向二次元动漫,MJ更偏向写实。剩下的直接看详细教程就好了[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)简单上手快。
#### 4.  Bing Image Creator相关
Bing Image Creator免费白嫖,质量不低,但是自由度太低。直接看详细教程就好了[Dall·E2和Bing的AI图像生成](https://docs.qq.com/doc/DUXV5clpHT1JaZGx4)简单上手快。
</details>
## 魔法全书索引
<details>
<summary>魔法全书索引(点击展开)</summary>
看完上述内容,我们就对现阶段的AI魔法有了一个基础的了解。那要如何学习进步呢?根据自己选择的工具和需求阅读下面的教程,相信只要用心,你也能成为大魔法师!
### 一、教程(点击跳转)
[AI福瑞绘画经书](https://docs.qq.com/sheet/DSUxoeG1CRFdObXFY?tab=BB08J2)**必看!好看的图片、咒语搜集**
SD纯纯入门级视频教程
[什么是AI绘画与stable diffusion讲解](https://docs.qq.com/doc/DSWVVYnZXdmhiTlBk)想进一步了解AI绘画原理的,和SD基本原理的可以看这一篇。前半部分是原理,写的比较晦涩难懂,可以跳过,后面SD的讲解写的很详细,想用SD的可以看一下。
[SD咒语和语法(WebUI或naifu)](https://docs.qq.com/doc/DSXBkTVZrUmpLdmpC)用SD的,不管是本地WebUI还是naifu还是自己租服务器还是用NovelAI的服务,都一定要看!
[niji操作与咒语的快问快答](https://docs.qq.com/doc/DSVZQTnZteHlMYmp3)用niji和MJ的一定要看这篇,从使用方法到语法到进阶都写在里面了。
[Dall·E2和Bing的AI图像生成](https://docs.qq.com/doc/DUXV5clpHT1JaZGx4)现在可以无限白嫖,快用!
[MJ与niji充值与白嫖手册](https://docs.qq.com/doc/DSVdrdm12TW9NZ2R1)现在写完了白嫖的部分
[谷歌Colab及Dreambooth教程](https://docs.qq.com/doc/DYW1XWkRwQXpmYU9O)(by Philip_ovo,补:DB已经被lora取代了,还是去学lora吧) colab服务器的使用方法和用DB炼模型的进阶教程(colab现在只能付费使用了,还是看看便宜一点的autodl和能白嫖三个月的阿里云吧家人们)
SD上常见furry模型介绍——还没写完,先不放链接了
[https://www.bilibili.com/read/cv22642045/](https://www.bilibili.com/read/cv22642045/)别人写的WebUI的使用基本教程,一万五千字很详细有效!我就不重复造轮子了。
进阶:
[流派&媒介&风格](https://docs.qq.com/doc/DSUpDUkFQdFdSVldn)一点咒语写作的小技巧
SD炼丹技法——还没写完,先不放链接了
SD插件和拓展——还没写完,先不放链接了
(4月更新)SD的进阶用法有LoRA、controlNet、分层控制、Hi-res等,这几种方法能够有效的提升图片质量!
[常见问题及解答(进阶知识和疑难杂症)](https://docs.qq.com/doc/DSVlydUlQdnVHaEtm)(持续更新)
[多WebUInaifu下复制ckpt模型占用本地空间过大问题的解决办法](https://docs.qq.com/doc/DSVR6WUxXbnRNU0hU)使用秋叶的启动器后几乎没人需要这个教程了。
[230523 召唤术的山铜圣杯——3D指导生成](https://docs.qq.com/pdf/DZEhjTnVpRWJMc2lw?)利用3D辅助完成召唤,by Cymblae
PS:看一下niji和SD的教程数量就知道了,niji的核心教程就一个很快就能学会,SD想要研究透需要有很多教程,都写不完,但是上限也是真的高,难度也是真的大。
### 二、其他网站、论坛
##### 1.社区、论坛
[https://discord.com/channels/1019133813105905664](https://discord.com/channels/1019133813105905664) discord上的Furry Diffusion社区,全球最大的福瑞AI社区,有一万多成员,从咒语到模型无所不包。缺点是英文+需要魔 法 上网,解决办法是翻译软件(电脑上推荐Edge浏览器或划词翻译插件)和steam++(电脑端最推荐,当然你有好用的t更好)。discord只要能登陆就很好注册,不管是使用niji或者MJ的服务还是上Furry Diffusion都需要有discord账号。另外Furry Diffusion的邀请链接是[https://discord.gg/furrydiffusion](https://discord.gg/furrydiffusion)。
除此之外国内的简中环境下有一些QQ群624959658(人最多,热闹)、806576305、723632315(可以发瑟瑟)、688250337(可以发瑟瑟)、473425574(只发兽太)和一个QQ频道25516t4y5v,直接加群讨论,别犹豫。
##### 2.官方网站
[https://github.com/AUTOMATIC1111/stable-diffusion-webui](https://github.com/AUTOMATIC1111/stable-diffusion-webui)WebUI的github发布页,如果想要自己部署WebUI可以看看。所有WebUI的插件和拓展都能在github上找到,但是用了秋叶的启动器后这些都可以不管。
[https://www.midjourney.com/app/](https://www.midjourney.com/app/)MJ的官网,使用discord登陆后能看到画廊,你在niji或MJ生成的图片都能在这找到。
[https://nijijourney.com/zh/](https://nijijourney.com/zh/)niji官网。
[https://novelai.net/](https://novelai.net/)NovelAI的官网,充值、画图、查看教程都可以从这里打开,但是全英。
[https://docs.novelai.net/image.html](https://docs.novelai.net/image.html)NovelAI官网的教程,全英,适用于naifu和NovelAI官网画图。
##### 3.SD的模型下载网站
[https://rentry.org/sdmodels#](https://rentry.org/sdmodels#)收录了早期的一些模型,其中大概有三分之一不到是furry模型,22年11月后停更。
Furry Diffusion社区的模型频道[https://discord.com/channels/1019133813105905664/1023552679395471431](https://discord.com/channels/1019133813105905664/1023552679395471431)可以说99%的furry模型都可以在这找到,但是是帖子的形式,有些信息不太简洁直观,要看很多对话才能找到一些必要的说明。
[https://civitai.com/](https://civitai.com/)CivitAI也许是全球最大的SD模型分享站?除了furry模型还有很多其他类型的模型。可以discord登陆收藏和评论模型,信息简介明了,图片和评论反馈数量和质量取决于模型热度。善用搜索功能(已经被墙,记得开t )。
[https://huggingface.co/models?pipeline_tag=text-to-image](https://huggingface.co/models?pipeline_tag=text-to-image)Hugging Face可以说是AICG界的github,除了SD模型,还有很多其他类型的AI,比如音频视频等,不再赘述。
##### 4.图源网站
furry图片的发布站,炼丹需要用到,平时学习咒语的tag也能用到。
e621:[https://e621.net/](https://e621.net/),Fur Affinity:[https://www.furaffinity.net/](https://www.furaffinity.net/),furry booru:[https://furry.booru.org/](https://furry.booru.org/)这三个网站甚至可以裸连。善用tag功能。即使不玩AI也可以收藏这三个网址。
##### 5.绘制结果发布网站
除了各大社交平台和群里外,你还可以在这里发布你的图片和咒语:
首先是咱自己的平台[AI绘画Furry魔咒与样张搜集口袋](https://docs.qq.com/form/page/DSXBMbWRydXVBVXhN)[niji画Furry魔咒与样张](https://docs.qq.com/form/page/DSWxNYUhnS1dXUHRJ),好的咒语记得填写到这里面,结果在[AI福瑞绘画经书](https://docs.qq.com/sheet/DSUxoeG1CRFdObXFY)查看。
[https://e6ai.net/](https://e6ai.net/) 6ai是专门搜集用AI生成的furry图像的网站。使用方法和e621相似。
[discord上的Furry Diffusion社区](https://discord.com/channels/1019133813105905664)也有很多子频道发布对应的图片。
还有一个 https://twitter.com/i/lists/1641421571419144193?s=09 推特上的AI 福瑞发布者清单,有些推文已经是千万级浏览了。
##### 6.搜索引擎
常见问题很多都能百度、谷歌到,视频内容也能在B站和油管找到大把教程。请善用搜索引擎。这里推荐两个B站up,[秋葉aaaki](https://space.bilibili.com/12566101)和[独立研究员-星空](https://space.bilibili.com/250989068)他们的视频对于使用SD的很有帮助(对于进阶的知识,我再推[大江户战士](https://space.bilibili.com/55123)和[青龙圣者](https://space.bilibili.com/219296/),他们的很多技巧是我们现在也很难完全理解和熟练使用的)。(虽然画的是furry,但是你遇到的问题可能和其他画二次元和写实的人一样)
</details>
PS:写的很匆忙,难免有错,如果发现问题或者对内容有疑问请直接批注或者联系我。
作者 雯森虔Jason Wen
CC BY-NC-SA 4.0,可非商用转载,需署名,相同方式共享。