观速讯丨GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

时间:2023-04-03 16:59:25 来源: 程序员客栈


(资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

标签:

精彩推送

手机圈新宠!真我GT5上手手感绝了

据真我副总裁徐起透露,真我GT5的旗舰质感前所未有,其打造的代价与概

来源:2023.08.25

北京食盐供应情况如何?都视频记者凌晨探访食盐配送中心

00:35北京日报客户端|记者马婧受日本核污染水排海影响,部分区域发生食

来源:2023.08.25

图解丨日本福岛核污染水排海后,如何影响中国和全球?

当地时间8月24日13时,日本政府正式启动福岛核污染水排海。曾经在中国

来源:2023.08.24

卫光生物:上半年营收净利双高增长,浆站平均采浆量行业领先

证券时报网讯,8月24日晚间,卫光生物(002880 SZ)披露半年度报告,20

来源:2023.08.24

途虎养车通过港交所上市聆讯

三言科技8月24日消息,据港交所文件显示,途虎养车通过港交所上市聆讯

来源:2023.08.24

2023中国国际装备制造业博览会时间及地点

2023中国国际装备制造业博览会时间及地点展会时间:2023年9月1日-9月5

来源:2023.08.24

极氪IPO计划募集10亿美元 估值预计超过130亿美元

易车讯据国内媒体报道,有知情人士透露吉利汽车旗下高端智能品牌极氪科

来源:2023.08.24

美商务部长访华,中美双方将讨论哪些话题?商务部回应

8月24日下午,商务部举行例行记者会。有媒体提问,中方计划同即将到访

来源:2023.08.24

中信证券:机器人行业发展趋势愈发明确

中信证券近日研报表示,近期机器人产业相关动作频出,政策方面各地陆续

来源:2023.08.24

新闻快讯

X 关闭

X 关闭

新闻快讯