如何简单高效地定制自己的文本作画模型?:头条焦点 - 行业动态 -

当前位置:首页  >  行业动态  > 正文

如何简单高效地定制自己的文本作画模型?:头条焦点

如何简单高效地定制自己的文本作画模型?:头条焦点
2023-01-02 16:29:29

强烈建议先阅读:一文弄懂 Diffusion Model

1. 论文信息

标题:Multi-Concept Customization of Text-to-Image Diffusion


【资料图】

作者:Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu.

原文链接:https://arxiv.org/pdf/2212.04488.pdf

代码链接:https://www.cs.cmu.edu/~custom-diffusion/

2. 引言

最近通过文本生成图像的深度学习相关技术取得了非常大的进展,2021已经成为了图像生成的一个新的milestone,诸如DALL-E和Stable diffusion这种模型都取得了长足的进步,甚至达到了“出圈”的效果。通过简单文本prompts,用户能够生成前所未有的质量的图像。这样的模型可以生成各种各样的对象、风格和场景,并把它们进行组合排序,这让现有的图像生成模型看上去是无所不能的。

但是,尽管这些模型具有多样性和一些泛化能力,用户经常希望从他们自己的生活中合成特定的概念。例如,亲人、朋友、宠物或个人物品和地点,这些都是非常有意义的concept,也和个人对于生成图像的信息有对齐。由于这些概念天生就是个人的,因此在大规模的模型训练过程中很难出现。事后通过详细的文字,来描述这种概念是非常不方便的,也无法保留足够多的视觉细节来生成新的personal的concepts。这就需要模型具有一定的“定制”能力。也就是说如果给定少量用户提供的图像,我们能否用新概念(例如宠物狗或者“月亮门”,如图所示)增强现有的文本到图像扩散模型?经过微调的模型应该能够将它们与现有概念进行概括并生成新的变化。这带来了几个比较严峻的挑战:

首先,模型倾向于遗忘现有概念的含义:例如,在添加“moon gate”这一concept的时候,“moon”的含义就会丢失。其次,由于stable diffusion这样的网络往往参数会超级多,所以在小数据上训练模型,容易造成对训练样本进行过拟合,而且采样中变化也有限。此外,论文还关注了一个更具挑战性的问题,即组group fine-tuning,即能够超越单个个体concept的微调,并将多个概念组合在一起。学习多个新的concepts同时也是存在一定的挑战的,比如 concept mixing以及concept omission。

在这项工作中,论文提出了一种fine-tuning技术,即文本到图像扩散模型的“定制扩散”。我们的方法在计算和内存方面都很有效。为了克服上述挑战,新方法固定一小部分模型权重,即文本到潜在特征的key值映射在cross-attention layer中。fine-tuning这些足以更新模型的新concepts。为了防止模型丧失原来强大的表征能力,新方法仅仅使用一小组的图像与目标图像类似的真实图像进行训练。我们还在微调期间引入data的augamation,这可以让模型更快的收敛,并获得更好的结果。论文提出的方法实验是构建在Stable Diffusion之上,并对各种数据集进行了实验,其中最少有四幅训练图像。对于添加单个concept,新提出的方法显示出比相似任务的作品和基线更好的文本对齐和视觉相似性。更重要的是,我们的方法可以有效地组成多个新concepts,而直接对不同的concepts进行组合的方法则遇到困难,经常会省略一个。最后,我们的方法只需要存储一小部分参数(模型权重的3%),消耗的GPU memory非常有限,同时也减少了fine-tuning的时间。

3. 方法

总结来讲,论文提出的方法,就是仅更新权重的一小部分,即模型的交叉注意力层。此外,由于目标概念的训练样本很少,所以使用一个真实图像的正则化集,以防止过拟合。

对于Single-Concept Fine-tuning,给定一个预训练的text-to-image diffusion model,我们的目标是在模型中加入一个新的concept,只要给定四张图像和相应的文本描述进行训练。fine-tuning后的模型应保留其先验知识,允许根据文本提示使用新概念生成新的图像类型。这可能具有挑战性,因为更新的文本到图像的映射可能很容易过拟合少数可用图像。所以保证泛化性就非常有必要,也比较有挑战。所以就仅仅fine-tuning新的K和V,而对于query,则保持不变,这样就可以增加新概念的同时,保证模型的表征能力不受到太多的影响。优化目标还是diffusion的形式:

概括起来实际上非常简单,就是训练一个k和v的矩阵,来扩充维度,增加模型的表征能力,使其能生成更为丰富的图像内容。

而对于Multiple-Concept Compositional Fine-tuning,为了对多个概念进行微调,我们将每个概念的训练数据集合并,并使用我们的方法将它们联合训练。为了表示目标概念,我们使用不同的修饰符的,并将它们与每个层的交叉注意关键和值矩阵一起初始化,并优化它们。通过将权重更新限制为交叉注意key和value参数,与DreamBooth等方法相比,可以显着更好地将两个概念合并在一起。

由于我们的方法仅更新与文本特征相对应的key和value投影矩阵,因此我们可以将它们合并,以允许使用多个微调概念生成。让集合表示预训练模型中所有交叉注意层的key和value矩阵,并且表示添加概念的相应更新矩阵。由于方法随后的优化适用于所有层和key矩阵,为了简洁起见忽略key和value的上标以及层。我们将合成目标表述为以下约束最小二乘问题:

这里,是维度为的文本特征。这些是个跨越所有个concept的目标词.

可以发现,增加约束还是让模型具有更强的表征能力的。最下面一行才和真正的门比较相似,同时生成的月亮也非常合理。

4. 实验

给定一个新concepts的图像如左侧显示的目标图像,提出的方法可以在看不见的上下文和艺术风格中生成带有该概念的图像。第一行:代表水彩画艺术风格中的概念。方法还可以在背景中生成山脉,而 DreamBooth 和 Textual Inversion 忽略了这一点。第二行:改变背景场景。我们的方法和 DreamBooth 的表现与 Textual Inversion 相似且更好。第三行:添加另一个对象,例如带有目标桌子的橙色沙发。新的方法成功地添加了另一个对象。第四行:改变对象属性,如花瓣的颜色。第五行:用太阳镜装饰私人宠物猫。我们的方法比基线更好地保留了视觉相似性,同时仅更改花瓣颜色或为猫添加太阳镜。

可以发现Multiple-Concept Compositional Fine-tuning的效果也非常惊艳。

风格迁移的效果也不错。

定量指标也有比较有竞争力的表现:

5. 结论

论文提出了一种基于new concepts的text-to-image生成模型的fine-tuning方法。只需使用一些有限的图像示例, 新方法就能一高效的方法生成微调概念的新样本同时保留原有的生成能力。而且,我们只需要保存一小部分模型权重。此外,方法可以连贯地在同一场景中组合多个新概念,这是之前的方法所缺少的能力。

标签: 一个新的 训练样本 艺术风格

(责任编辑:news01)
异动快报:ST云城(600239)11月30日9点32分触及涨停板

异动快报:ST云城(600239)11月30日9点32分触及涨停板

11月30日盘中消息,9点32分ST云城(600239)触及涨停板。目前价格2 1,上涨4 48%。其所属行业房地产开...
11-30 09:29:32
世界速看:浙版传媒: 浙江出版传媒股份有限公司独立董事关于第二届董事会第七次会议相关事项的独立意见

世界速看:浙版传媒: 浙江出版传媒股份有限公司独立董事关于第二届董事会第七次会议相关事项的独立意见

浙版传媒:浙江出版传媒股份有限公司独立董事关于第二届董事会第七次会议相关事项的独立意见
11-29 14:38:42
天通股份: 天通股份关于实际控制人之一致行动人部分股份解除质押的公告

天通股份: 天通股份关于实际控制人之一致行动人部分股份解除质押的公告

天通股份:天通股份关于实际控制人之一致行动人部分股份解除质押的公告
11-24 20:21:15
加快建设世界知名旅游目的地 推动湖南省旅游业高质量发展

加快建设世界知名旅游目的地 推动湖南省旅游业高质量发展

7月19日上午,省委书记、省人大常委会主任张庆伟主持召开专题办公会议,听取首届湖南旅游发展大会组织筹...
07-20 15:48:20
总投资2.5亿元!西盟县一批重大项目相继开工建设

总投资2.5亿元!西盟县一批重大项目相继开工建设

今年以来,西盟佤族自治县实施项目攻坚、狠抓项目推进,一批投资额度大、辐射带动强、社会效益好的重大...
06-21 14:25:50
广西3.8亿元专项资金 支持漓江流域横向生态补偿

广西3.8亿元专项资金 支持漓江流域横向生态补偿

6月17日,记者从自治区生态环境厅获悉,2022年,自治区本级财政将继续统筹生态环境保护、自然资源事业发...
06-20 14:57:14
中国铁塔安徽淮北分公司 主动开展专项活动

中国铁塔安徽淮北分公司 主动开展专项活动

为加强公司资产管理,提高一体业务收入准确性,今年以来,中国铁塔安徽淮北分公司主动开展专项活动,对...
03-18 17:43:05
无锡电信“六个一”优化人工成本管理 助力新兴业务发展

无锡电信“六个一”优化人工成本管理 助力新兴业务发展

中国电信江苏无锡分公司持续优化人工成本管理,完善绩效薪酬激励机制,切实提高全口径人力资源使用效率...
03-18 17:43:04
售卖“应付检查”消防喷淋头 中国消防点名电商平台

售卖“应付检查”消防喷淋头 中国消防点名电商平台

  售卖“应付检查”消防喷淋头!中国消防点名电商平台:到底你在应付谁?  人民网北京10月11日电 (...
10-12 14:06:22
陕西一煤矿发生局部冒顶事故 致4人遇难4人重伤

陕西一煤矿发生局部冒顶事故 致4人遇难4人重伤

  中新网西安10月12日电 (记者 阿琳娜)记者12日从陕西咸阳市官方获悉,11日一煤矿发生局部冒顶事故...
10-12 14:06:22
“90后”女大学生返乡“带货”:我有振兴故乡的责任

“90后”女大学生返乡“带货”:我有振兴故乡的责任

  中新网吉林10月12日电 (记者 石洪宇)面对红叶浸染的山峦,27岁的刘佳宁很快找到创作灵感,成熟的...
10-12 14:06:22
浙江杭州钱镠墓被盗案开庭宣判 被告人处无期徒刑

浙江杭州钱镠墓被盗案开庭宣判 被告人处无期徒刑

  10月12日上午,浙江省杭州市中级人民法院一审公开开庭审理被告人蒋明磊、李常伟盗掘古墓葬一案并当...
10-12 14:06:22
作风之变助推发展之变

作风之变助推发展之变

  作风之变助推发展之变  ——四川剑阁深入推进“我为群众办实事”实践活动  光明日报记者 李晓...
10-12 14:06:22
齐晓景:就想为农村做点啥

齐晓景:就想为农村做点啥

  【奋斗青春 无悔抉择】  光明日报记者 陈晨 高平光明网记者 董大正  “这草莓西红柿,脆爽...
10-12 14:06:22
陕西彬长矿业公司胡家河矿发生一起局部冒顶事故致4人死亡

陕西彬长矿业公司胡家河矿发生一起局部冒顶事故致4人死亡

  新华社西安10月12日电(记者薛天、张思洁)记者从陕西煤业化工集团有限公司及咸阳市委宣传部获悉,10...
10-12 14:06:21
京秦高速遵秦段加紧施工建设

京秦高速遵秦段加紧施工建设

  目前,由中建路桥集团参与承建的京秦高速公路遵(遵化)秦(秦皇岛)段正在加紧施工,各项工程进展顺利...
10-12 14:06:21
护航法治中国行稳致远

护航法治中国行稳致远

  【坚持和完善人民代表大会制度】   检查21部法律和1个决定的实施情况,听取审议“一府一委两院”...
10-12 14:06:21
记录历史的耄耋老兵:让家乡的英雄故事永流传

记录历史的耄耋老兵:让家乡的英雄故事永流传

  中新网石家庄10月12日电 题:记录历史的耄耋老兵:让家乡的英雄故事永流传  作者 赵丹媚  见...
10-12 14:06:21
山西因灾停电用户95%以上已恢复供电

山西因灾停电用户95%以上已恢复供电

  新华社太原10月12日电(记者梁晓飞)记者12日从国网山西省电力公司了解到,受近日强降雨影响,山西运...
10-12 14:06:20
浙江仙都黄帝祭典弦歌不绝 慎终追远赓续中华根脉

浙江仙都黄帝祭典弦歌不绝 慎终追远赓续中华根脉

  中新网丽水10月12日电(记者 范宇斌)四海同心祭始祖,共同富裕启华章。辛丑(2021)年中国仙都祭祀轩...
10-12 14:06:20
教育部:校外培训机构登记为非营利前暂停招生收费

教育部:校外培训机构登记为非营利前暂停招生收费

  记者12日从教育部了解到,教育部校外教育培训监管司近日就校外培训机构“营改非”工作作出部署,要...
10-12 14:06:20
山西介休部分村庄启动灾后消杀防疫

山西介休部分村庄启动灾后消杀防疫

  中新网晋中10月12日电 (记者 陆祁国)随着抽排洪水作业进度加快,部分村庄积滞洪水水位明显下降。1...
10-12 14:06:20
中国新疆“河狸公主”:一百万中国青年救助保护河狸

中国新疆“河狸公主”:一百万中国青年救助保护河狸

  (生物多样性大会)中国新疆“河狸公主”:一百万中国青年救助保护河狸  中新社昆明10月12日电 题...
10-12 14:06:20
“母亲河畔的中国”网络主题活动在河南开封启动

“母亲河畔的中国”网络主题活动在河南开封启动

  中新网开封10月12日电 12日上午,“母亲河畔的中国”网络主题活动启动仪式在河南开封举行。  本...
10-12 14:06:20
陕煤彬长公司一煤矿发生局部冒顶事故 4人死亡

陕煤彬长公司一煤矿发生局部冒顶事故 4人死亡

  记者从陕西省咸阳市委宣传部获悉,10月11日13时50分许,陕煤彬长公司胡家河煤矿402104工作面发生局...
10-12 14:06:19
广东海警局联合广东省公安厅开展“清湾行动” 查获非法船舶860艘

广东海警局联合广东省公安厅开展“清湾行动” 查获非法船舶860艘

  中新网北京10月12日电 为坚决遏制珠江口水域走私活动多发态势,坚决打击违法犯罪分子嚣张气焰,全...
10-12 14:06:19
浙江长兴公安摧毁一盗掘古墓犯罪团伙 追回文物40余件

浙江长兴公安摧毁一盗掘古墓犯罪团伙 追回文物40余件

  中新网湖州10月12日电(施紫楠 吴俊杰)在小说和影视剧中,盗墓者常被称为“摸金校尉”,十分神秘。...
10-12 14:06:19
山西 陕西两地加紧防汛救灾

山西 陕西两地加紧防汛救灾

  央视网消息(新闻联播):山西、陕西两地加紧防汛救灾。今天(10月11日),财政部、应急管理部向两省紧...
10-12 14:06:19
强降雨致山西公路灾损6021.36公里

强降雨致山西公路灾损6021.36公里

  记者今天(10月12日)从山西省人民政府召开的新闻发布会上了解到,受连续强降雨影响,山西公路交通基...
10-12 14:06:19
哈尔滨多地风险等级调整为低风险

哈尔滨多地风险等级调整为低风险

  中新网哈尔滨10月12日电 (记者 刘锡菊)12日,哈尔滨市应对新冠肺炎疫情工作指挥部发布关于调整哈...
10-12 14:06:19

为您推荐

精彩推送