爱情电影网怎么了 Decrypt 判辨扩散指南:最强盛的 AI 图像生成开源器用
发布日期:2024-09-09 00:35 点击次数:111
图片
Stable Diffusion 是一种文本到图像生成东说念主工智能器用,这意味着它将翰墨迂回为图像。这个过程类似于将详确的简介邮寄给一位画家,然后恭候尽心创作的艺术品的复返。
将判辨扩散视为你个东说念主的基于东说念主工智能的创意盟友。这种深度学习模子主淌若为了字据文本教导生成图像而想象的,它超越了单一功能。它还可用于建设(转换图像的部分)、狡饰(将图像推广到其现存范围以外)以及字据文本教导翻译图像。这种多功能性特别于领有一位多艺多才的艺术家供你使用。
判辨扩散的力学
判辨扩散基于深度学习模子运行,该模子字据文本描画制作图像。其支撑是扩散过程,其中图像通过一系列要领从立地噪声挪动为连贯图像。该模子经过磨真金不怕火可以指示每个阶段,从而字据提供的文本教导率领从泉源到完成的通盘这个词过程。
判辨扩散背后的中心想想是将噪声(立地性)迂回为图像。该模子以一堆立地噪声(想象一下来自无信号电视的白噪声的彩色版块)来启动该过程,然后在文本教导的影响下渐渐细化为可阔别的图像。这种细化系统地进行,判辨地减少噪声并增强细节,直到出现高质料的图像。
跟着扩散过程的泉源,初步阶段在很猛进度上决定了图像的举座构图,随后的关节字转换仅影响较小的部分。这强调需要仔细谨慎关节字权重和时候安排,以达成你想要的罢了。
判辨扩散的优点和污点
判辨扩散的优点之一是,它擅长创建详确的高质料图像,并字据特定教导进行定制想象。它可以松驰地浏览各式艺术立场,无缝交融不同艺术家的技能,并在不同的关节词之间平滑过渡。
与 MidJourney等同类居品不同,Stable Diffusion 是免费的,这对你的预算来说是一个福音。它亦然开源的,这意味着你可以字据需要对其进行修改。无论你渴慕创造将来派欢畅如故动漫立场的图像,判辨扩散皆有一个得当你的模子。稍后咱们将深入猜测怎样下载并字据你的喜好定制这些模子。
你可以离线运行它,无需不息的互联网聚拢或服务器拜访,这使其成为着重隐秘的用户的可贵器用。
关联词,也有一些污点,与 MidJourney 不同,Stable Diffusion 具有陡峻的学习弧线。要生成信得过出色的图像,你必须使用自界说模子、插件和一些教导工程。这有点像 Windows 与 Linux 的情况。
此外,该模子有时会进展出不成预见的关联,从而导致不测的罢了。教导中的微弱演叨可能会导致输出出现弱点偏差。举例,在教导中指定眼睛情态可能会或然中影响生成的脚色的种族(举例,蓝眼睛每每与白种东说念主关连)。因此,为了获取最好罢了,必须深入了解其职责旨趣。
此外,教导中需要大量细节身手提供令东说念主印象潜入的罢了。与 MidJourney 不同,MidJourney在“一个好意思艳的女东说念主在公园漫衍”等教导下进展致密,而判辨扩散需要对你但愿(或不但愿)在图像中看到的通盘内容进行全面描画。为冗长、详确的教导作念好准备。
操作判辨扩散
运行判辨扩散的要领有多种,可以通过基于云的平台,也可以平直在腹地狡计机上。
以下是一些可让你在云中测试它的在线平台:
Leonardo AI:允许你尝试不同的模子,其中一些模子师法 MidJourney 的好意思学。
Sea Art:使用插件测试大量判辨扩散模子的好方位是其他高档器用。
Mage Space:提供判辨扩散版块 v1.5 和 2.1。尽管它有大量其他模子,但它需要会员资历。
Lexica:一个用户友好的平台,可率领你发现图像的最好教导。
Google Colabs:另一个易于拜访的选项。
然而,如果你取舍腹地装置,请确保你的狡计机具有必要的功能。
系统条目
要在腹地运行 Stable Diffusion,你的 PC 应运行 Windows 10 或更高版块,况且至少配备具有至少 4 GB VRAM 的稳固 Nvidia 显卡 (GPU)、16GB RAM 和至少 10GB 可用空间。
为了获取最好体验,提出使用具有 12GB vRAM、32GB RAM 和高速 SSD 的 RTX GPU。磁盘空间将取决于你的具体需求:你运筹帷幄使用的模子和附加组件越多,你需要的空间就越多。一般来说,模子需要 2GB 到 5GB 的空间。
使用自动 1111 导航判辨扩散
黄色小电影当你泉源判辨扩散之旅时,取舍正确的图形用户界面 (GUI) 变得至关蹙迫。在绘制方面,Invoke AI处于当先地位,而SD.Next 则着重着力。ComfyUI是一个基于节点的超轻量级选项,由于与新的 SDXL 兼容,最近获取了很大的护理。关联词,Automatic 1111以其流行性和用户友好性成为最受接待的。让咱们深入探讨怎样泉源使用 Automatic 1111。
图片
运行判辨扩散的两个不同的 GUI(A1111 和 ComfyUI)
建设自动 1111
由于此存储库上提供了一键式装置程序,Automatic 1111 的装置过程并不复杂。插足 Github 页面的“assets”部分,下载 .exe 文献并运行它。这可能需要一些时候,是以请援助下去 - 请记着,耐烦是关节。
见效装置后,“A1111 WebUI”快捷花样将在新掀开的文献夹中出现。沟通将其固定到任务栏或创建桌面快捷花样以便于拜访。单击此快捷花样将启动判辨扩散,为你的创意敕令作念好准备。
最好勾选以下复选框:自动更新 WebUI(使程序保持最新)、自动更新推广(保持插件和第三方器用更新),况且,如果你的电脑功能不是那么强盛,还应激活低 VRam (medvram) 和启用 Xformers 的选项。
图片
启动 A1111 之前出现的屏幕
了解用户界面
装置了 A1111 的判辨扩散后,掀开它时你将看到以下内容
图片
自动 1111 GUI
但不要被吓倒。以下是运行判辨扩散时界面的简要浏览:
检查点或模子:推行上是 AI 图像操作背后的中枢,这些事先磨真金不怕火的判辨扩散权重可以与接收不同派别的不同艺术家进行相比。一个东说念主可能擅长动画,而另一个东说念主则擅长现实主义。你在这里的取舍决定了你图像的艺术立场。
积极教导:这是你在形象中抒发你想要的东西的方位。
商酌教导:在此指定你不但愿在你的作品中看到的内容。
创建神态:如果你但愿将正面和负面教导的特定组合保存为“神态”以供将来使用,请单击此处进行操作。
应用神态:将往时保存的神态应用到面前教导。
生成:建设完通盘参数后,单击此处使你的图像历历如绘。
采样要领:此参数界说将立地噪声挪动为最终图像所采选的要领。20 到 75 之间的范围每每会产生致密的罢了,25-50 是实用的中间值。
采样要领:如果模子代表该程序的中枢,那么采样器即是一切背后的大脑。这是用于获取教导、编码器和每个参数并字据你的敕令将噪声迂回为连贯图像的技能。有好多采样器,但咱们推选“DDIM”用于快速渲染,只需几个要领,“Euler a”用于皮肤光滑的东说念主的画图或像片,“DPM”用于详确图像(DPM++ 2M Karras 可能是一个可以的安全取舍) 。以下是使用判辨扩散的不同采样要领获取的罢了的汇编。
批次计数:批次计数将一个接一个地运行多批生成。这将允许你使用沟通的教导创建不同的图像。这需要更长的时候,但使用更少的 vRAM,因为每个图像皆是在前一个图像完成青年景的
批次大小:这是每个批次中有若干并行图像。这将为你提供更多图像,速率更快,但也需要更多 vRAM 来科罚,因为它会在吞并代中生成任何图像。
CFG比例:它决定了模子的创作解放度,在罢职你的教导和我方的想象力之间取得均衡。较低的 CFG 将使模子忽略你的教导并更具创造性,较高的 CFG 会使其彻底莫得解放地援助下去。5 到 12 之间的值每每是安全的,7.5 提供可靠的中间值。
宽度和高度:在此处指定图像尺寸。肇端分辨率可以是 512X512、512X768、768x512 或 768x768。关于 SDXL(Stability AI 的最新式号),基分内辨率为 1024x1024
种子:将其视为图像的独一 ID,为开动立地噪声建设参考。如果你筹划复制特定罢了,这小数至关蹙迫。此外,每个图像皆有一个特有的种子,这即是为什么不成能信得过 100% 复制特定的现实糊口图像 - 因为它们莫得种子。
骰子图标:将种子建设为 -1,使其立地化。这保证了每个图像生成的独一性。
回收图标:保留前次图像生成的种子。
剧本:它是履行影响你的职责历程的高档指示的平台。作为入门者,你可能但愿暂时保持不变。
保存:将生成的图像保存在你取舍的文献夹中。请谨慎,判辨扩散还会自动将图像保存在其专用的“输出”文献夹中。
发送到 img2img:将你的输启程送到 img2img 选项卡,使其成为类似它的新一代的参考。
发送到建设:将图像定向到建设选项卡,使你大概修改特定图像区域,举例眼睛、手或伪像。
发送到额外内容:此操作会将你的图像再行定位到“额外内容”选项卡,你可以在其中治愈图像大小,而不会丢失大量细节。
即是这么——一切皆准备好了!当今爱情电影网怎么了,让你的创造力尽情施展,见证判辨扩散的神奇魔力。
教导工程 101:怎样为 SD v1.5 制作致密的教导
判辨扩散的见效很猛进度上取决于你的教导——将其视为指示东说念主工智能的指南针。细节越丰富,生成的图像就越准确。
快速制作有时可能看起来令东说念主怕惧,因为判辨扩散不罢职线性模式。这是一个充满尝试和差错的过程。从教导泉源,生成图像,取舍你可爱的输出,修改你景仰或但愿摈斥的元素,然后再行为手。冲洗并近似这个过程,直到你的精品通过建设治愈和不懈的改良而出现。
正面教导、负面教导和微调关节词权重
Stable Diffusion 的想象可以通过语法(关节字:因子)治愈关节字权重。低于 1 的要素会淡化其蹙迫性,而高于 1 的要素会放大其蹙迫性。要把握权重,请取舍特定关节字并按 Ctrl+Up 加多或按 Ctrl+Down 减少。此外,你可以使用括号——使用的越多,关节字的权重就越大。
修饰符为你的图像添加终末的丽都,指定心绪、立场或细节(如“阴沉、复杂、高度详确、了了的焦点”)等元素。
积极的教导详细了你想要的元素。快速构建的可靠战术是按法例指定图像类型、主题、引子、立场、配景或欢畅、艺术家、使用的器用和分辨率。civita.com 的演示可以是“真的感渲染、(数字绘画)、(最好质料)、宁静的日本花圃、绽开的樱花、(((锦鲤池)))、东说念主行桥、浮屠、浮世绘艺术立场,北斋灵感,特别艺术流行,8k超写实,柔柔的配色决议,柔柔的灯光,黄金时刻,宁静的氛围,欢畅导向”
违犯,负面教导详确讲解了你但愿从图像中清除的通盘内容。示例包括:阴沉的情态、丑陋、灾祸的手、太多的手指、NSFW、交融的动作、最差的质料、低质料、蒙眬、水印、文本、低分辨率、长脖子、超出框架、过剩的手指、变异的手、单色、丑陋的、近似的、病态的、不良的剖解结构、不良的比例、毁容、低分辨率、变形的手、变形的脚、变形的脸、变形的身体部位、((沟通的发型))等。不要发怵用不同的词。
沟通教导的一个好要领是“What+SVCM(主语、动词、高下文、修饰语) ”结构:
内容:详情你想要的内容:肖像、像片、插图、绘画等。
主题:描画你正在沟通的主题:一个好意思艳的女东说念主、一个超等硬人、一个亚洲老东说念主、一个黑东说念主士兵、小孩、好意思艳的欢畅。
动词:描画拍摄对象正在作念什么:女东说念主正在对着镜头摆姿势吗?超等硬人是飞如故跑?亚洲东说念主是浅笑如故特等?
配景:描画你的想法中的场景:场景发生在那处?在公园、在教室、在拥堵的城市?尽可能具有描画性
修改器:添加相关图像的附加信息:如果是图片,则使用哪个镜头。如果是一幅画,是哪位艺术家画的?使用哪种类型的照明,哪个地点会选拔这种照明?你正在沟通哪种服装或前锋立场,图像吓东说念主吗?这些主见用逗号分隔。但请记着,越接近泉源,它们在最终作品中就越隆起。如果你不知说念从那处泉源,如果你不想仅仅复制/粘贴其他东说念主的教导,这个网站和这个Github 存储库有好多好主意供你尝试
因此,积极教导的一个例子可以是:在一家蓬勃的货仓里对着镜头摆姿势的可人贵客犬的肖像,(((黑尾巴)))、秋天、散景、精品、强光、胶片颗粒、佳能 5d 标记4、F/1.8、Agfacolor、空幻引擎。
商酌教导不需要合适的结构,只需添加你不可爱的通盘内容,就好像它们是修饰符相同。如果你生成图片并看到一些你不可爱的内容,只需将其添加到商酌教导中,再走运行生成并评估罢了即可。这即是东说念主工智能图像生成的旨趣,这并不是什么古迹。负面教导的一个例子可以是:蒙眬、画得不好、猫、东说念主类、东说念主、素描、恐怖、丑陋、病态、变形、标志、文本、不良剖解学、不良比例
关节词整合和实时安排
关节字搀杂或教导退换选拔语法[关节字1:关节字2:因子]。该因子是一个介于 0 和 1 之间的数字,决定在哪一步从关节字 1 切换到关节字 2。
懒惰的前程:复制教导
如果你不祥情从那处泉源,请沟通诓骗各个网站的想法并进行治愈以知足你的需求。教导的优秀起首包括:
奇维泰
辞书
判辨的扩散网
教导硬人
或者,保存你观赏的东说念主工智能生成的图像,将其拖放到“PNG 信息”选项卡上,判辨扩散会提供再行创建它的教导和关连信息。如果图像不是 AI 生成的,请沟通使用 CLIP Interrogator 插件来更好地贯通其描画。相关此附加组件的更多详确信息将在指南后头提供。
幸免罗网
判辨扩散的着力取决于它给出的教导。着重细节和准确性,提供了了具体的教导并爱好主见而不是解释至关蹙迫。不要尽心想象一个句子来描画广博、当然光泽豪阔的场景,而只需说“广博、当然光泽”。
请谨慎某些属性可能带来的不测关联,举例指定眼睛情态时的特定种族。对这些潜在罗网保持警惕可以匡助你制定更灵验的教导。
请记着,你的指示越具体,你的罢了就越容易禁止。然而,如果你假装创建长教导,请务必留意,因为使用矛盾的关节字(举例长发,然后寇仇发进行排序,或者商酌教导中的蒙眬和信服教导中的蒙眬)可能会导致不测罢了:
装置新模子
装置模子是一个简单的过程。最先详情得当你需求的模子。Civita 是一个很好的启程点,它以最大的判辨扩散器用存储库而闻明。与其他替代决议不同,Civita 饱读吹社区共享他们的训戒,为模子的功能提供视觉参考。
拜访 Civita,单击过滤器图标,然后在“模子类型”部分中取舍“检查点”。
图片
Civitai 使用过滤器让用户个性化搜索/Jose Lanz/Decrypt Media
然后,浏览网站上通盘可用的模子。请记着,判辨扩散未经审查,你可能会碰到 NSFW 内容。取舍你可爱的型号并单击下载。确保模子具有 .safetensor 推广名以确保安全(旧模子使用 .ckpt 推广名,但不太安全)。
图片
从 Civitai 下载特定自界说 SD v1.5 模子的页面示例。
下载后,将其放入腹地 Automatic 1111 的模子文献夹中。为此,请导航到装置 A111 Stable Diffusion 的文献夹,然后按照以下路子操作:“stable-diffusion-webuimodelsStable-diffusion”
少见百种型号可供取舍,但作为参考,咱们的一些首选是:
如果你想玩传神的图像,请使用 Juggernaut、Photon、Realistic Vision 和 aZovya Photoreal。
Dreamshaper、RevAnimated 以及 DucHaiten 的通盘模子(如果你可爱 3d 艺术)。
DuelComicMix、DucHaitenAnime、iCoMix、DucHaitenAnime 如果你可爱漫画和漫画等 2D 艺术。
裁剪图像:图像到图像和建设(待服务项)
判辨扩散还允许你使用 AI 裁剪你不可爱的图像。你可能想要转换构图的艺术立场,在天外中添加鸟类,删除东说念主工成品,或修改手指过多的手。为此,有两种技能:图像到图像和建设。
图片
由 Stable Diffusion(右)基于用作参考的像片(左)使用 Img2img/Jose Lanz 创建的图像
图像到图像推行上是让判辨扩散使用另一张图片作为参考来创建新图像,无论它是真的图像如故你创建的图像。为此,只需单击图像到图像 (Img2Img) 选项卡,将参考图像放入相应的框中,创建你但愿狡计机罢职的教导,然后单击生成。需要谨慎的是,你应用的降噪强度越大,新图像与原始图像的相似进度就越低,因为判辨扩散将具有更多的创作解放度。
知说念了这小数,你可以作念一些很酷的手段,比如扫描你祖父母的旧像片作为参考,通过低降噪强度的判辨扩散和一个相配蒙眬的教导(如“RAW,4k 图像,高度详确”)运行它们,望望怎样东说念主工智能重建你的像片。
建设允许你在原始图像中绘制或裁剪内容。为此,从吞并个 Img2Img 选项卡中,取舍建设选项并将参考绘画舍弃在那里。
然后,你只需绘制要裁剪的区域(举例,脚色的头发)并添加要创建的教导(举例,直长的金发),就完成了!
图片
使用建设在金发女超东说念主的参考图像上裁剪蓝色头发。由 AI/Jose Lanz 生成
咱们提出身成多批图像,以便你可以取舍最可爱的图像并修改教导。关联词,终末,如果你相配选藏,手头有一个像 Photoshop 这么的器用老是有平允的,这么可以得到完好的罢了。
增强判辨扩散功能的 5 大推广
当今你如故老成了判辨扩散,你可能渴慕进一步施展你的创造力。也许你想要固定特定的手部位置、强制模子生成五指手、指定某种类型的衣着、增强细节、使用特定的脸部,或者将小图像迂回为大型 8K 文献,同期尽可能减少细节圆寂。
推广可以匡助你达成这些目的。诚然有许多可用选项,但咱们重心先容了五个必备推广:
LoRA:细节决定成败
图片
不使用 LoRA 生成的图像与使用 LoRA 生成的沟通图像以添加更多细节。
LoRA 是旨在增强模子特异性的文献,无需下载全新模子。这使你可以完善细节,选拔特定的相貌、服装或立场。
要装置 LoRA,请按照下列要领操作:
单击“推广”选项卡并取舍“从 URL 装置”。
在框中输入 URL:https: //github.com/kohya-ss/sd-webui-additional-networks.git ,然后单击“装置”。
完成后,单击“已装置”,然后单击“应用并再行启动 UI”。
装置 LoRA 的要领与装置模子沟通。在 Civitai 上,将过滤器建设为“LoRA”,并使用以下旅途将文献放入 LoRA 文献夹中:stable-diffusion-webuimodelsLora
请记着,某些 LoRA 需要在教导中输入特定关节字身手激活,因此请务必在使用前阅读其讲解。
要使用 LoRA,请导航到 text2img 选项卡,单击类似小画的图标(透露/荫藏额外汇聚),LoRA 将出当今教导下方。
ControlNet:开释视觉魔法的力量
图片
不使用 LoRA 生成的图像与使用 LoRA 生成的沟通图像以添加更多细节。
如果你对判辨扩散的功能尚未作念出决定,请让 ControlNet 推广成为最终的谜底。ControlNet 领有庞大的多功能性和强盛功能,使你大概从参考图像中索要构图,解释我方是图像生陈规模的游戏章程蜕变者。
ControlNet 如实是万事通。无论你是需要复制姿势、模拟配色决议、再行想象你的糊口空间、制作五指手、在不使 GPU 包袱过重的情况下履行真的无尽的升级,如故将简单的涂鸦挪动为令东说念主赞赏的 3D 渲染或传神的视觉着力,ControlNet 皆可认为你提供匡助。花样。
装置 ControlNet 触及以下简单要领:
拜访推广页面并取舍“从 URL 装置”选项卡。
将以下 URL 粘贴到“推广存储库的 URL”字段中:https: //github.com/Mikubill/sd-webui-controlnet
单击“装置”。
关闭判辨扩散界面。
要启用 ControlNet,你需要从此存储库下载模子:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main
然后,将通盘下载的文献复制到此文献夹中:stable-diffusion-webuiextensionssd-webui-controlnetmodels
再行启动判辨扩散后,你会谨慎到 text2img 选项卡中出现了一个新的“ControlNet”部分。
向你提供两个主要选项:用于拖放参考图像的框、控件类型取舍和预科罚器。
“参考图像框”是你上传想要参考的姿势、脸部、色调组成、结构等的图像的方位。
“禁止类型取舍”是 ControlNet 魔法发生的方位。此功能允许你详情要复制或禁止的内容。
你还有其他更高档的选项可让你微调罢了:预科罚器(用于激活禁止网的技能)、权重(你的参考有多蹙迫)和泉源/罢了点(禁止网何时泉源/罢了其影响)
以下是每种控件类型的功能的快速详细:
OpenPose:精详情位身体的关节部位并复制姿势。你可以使用预科罚器取舍通盘这个词身体、面部或手部的姿势。
Canny:将你的参考图像迂回为带有细线的吊问涂鸦。这允许你的创作罢职这些线条作为角落,从而与你的参考准确相似。
深度:生成“深度图”以创建图像的 3D 印象,分辩近处和远方的对象 - 相配得当师法 3D 电影镜头和场景。
法线:法线贴图推断名义的宗旨,相配得当为盔甲、织物和外部结构等对象提供纹理。
MLSD:识别直线,相配得当再现建筑想象。
艺术线条:将图像迂回为画图 - 关于动漫和卡通等 2D 视觉着力相配有用。
Softedge:与 Canny 模子类似,但角落更柔柔,为模子提供更多解放度,但精度稍低。
涂鸦:将图像迂回为涂鸦,产生比 Canny 模子更通用的罢了。此外,你还可以在绘画上创建涂鸦,并将其用作参考,无需预科罚器即可将图像酿成现实的创作。
分割:创建图像的情态图,推断其中的对象。每种情态代表一种特定的物体。你可以使用它来再行结巴你的图像,或者再行想象具有沟通主见的场景(举例,将 1800 年代的像片酿成赛博一又克替代现实中沟通欢畅的传神描写,或者仅仅用不同的床、墙壁再行结巴你的房间不同情态等)
平铺:向图片添加细节并促进放大,而不会使 GPU 包袱过重。
建设:修改图像或推广其细节。当今,借助最近的更新和“仅建设 + 骆驼”模子,你可以极其着重细节地绘制图像
立地播放:再现参考图像的情态结构。
参考:生成在立场、构图和偶尔的相貌方面与你的参考相似的图像。
T2IA:让你禁止图像的情态和艺术构图。
图片
掌执这些选项可能需要时候,但它们提供的纯真性和定制性值得付出致力于。在线稽查各式教程和率领视频,以充分诓骗 ControlNet。
Roop:Deepfakes举手投足
Roop 提供了一种松驰的要领来生成传神的深度伪物。Roop 无需科罚复杂的模子或 LoRA,而是可以科罚笨重的职责,使你只需单击几下即可创建高质料的深度伪物。
要下载并激活,请按照官方 Roop Github 存储库上的讲解进行操作
要使用它,请创建教导,导航到 Roop 菜单,上传参考面,启用它,然青年景图像。为了获取最好着力,请使用你想要复制的脸部的高分辨率正面像片。请记着,吞并个东说念主的不同图像可能会产生不同的罢了 - 有些比其他图像更传神。
Photopea:Photoshop 判辨扩散的力量
图片
Photopea 推广在 A1111 里面的外不雅
有时,需要手动治愈身手获取完好的罢了,这即是 Photopea 的用武之地。此推广将类似 Photoshop 的功能平直引入判辨扩散界面,使你无需切换平台即可微调生成的图像。
你可以从此存储库装置 Photopea:https://github.com/yankoliveira/sd-webui-photopea-embed
CLIP 猜测器:从任何图像创建教导
如果你不知说念从那处泉源使用教导,那么这是一个很棒的器用。拍摄一张图像,将其放入框中,运行猜测器,它会告诉你哪些单词可以与你提供的图像关连联。
CLIP Interrogator 是一个便捷的器用,用于从特定图像中导出关节字。通过团结 OpenAI 的 CLIP 和 Salesforce 的 BLIP,该推广可以生成与给定参考图像匹配的文本教导。
你可以从此存储库装置:https://github.com/pharmapsychotic/clip-interrogator-ext.git
论断
通过判辨扩散,你将成为视觉管弦乐队的专家。无论是“艾玛·沃特森作为女巫的超现实肖像”如故“幻想环境中海盗的复杂数字绘画”,独一的限定即是你的想象力。
当今,用你新发现的常识武装起来,连续将你的瞎想描写成现实,一次一个文本教导。
图片
由 Decrypt 使用 AI/Jose Lanz 创建的图像爱情电影网怎么了
本站仅提供存储服务,通盘内容均由用户发布,如发现存害或侵权内容,请点击举报。