广州二手旧变压器回收_广州配电柜回收_广州电力变压器配电柜回收网

网站首页 > 稳压变压器回收

一张照片生成3D头像!苹果新模型击败StyleGAN2,表情光线都能调,网友:要用于MR?

广东益福二手变压器回收信息网,长期高价回收广州变压器回收,二手变压器回收,广州电力变压器回收,广州废旧变压器回收,二手电缆回收,二手空调回收,废纸回收,打印机回收,复印机回收,溴化锂中央空调,发电机回收,蓄电池回收,电脑回收,变压器回收,配电柜回收,倒闭工厂回收,倒闭酒店回收等废旧物资回收服务,联系电话:18664666166,联系人:张先生

一张照片生成3D头像!苹果新模型击败StyleGAN2,表情光线都能调,网友:要用于MR?

随便一张照片,就可生成3D头像。而且光线真实,随意角度可调。

这是苹果的最新黑科技生成框架FaceLit

正如其名,FaceLit的特色就是可以将人脸“点亮”。

“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——

进行3D建模时,需要的照片素材无需专业选择角度,数量上也只需一张。

甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。

而传统的头像合成工具没准需要多张图片才能工作,或者对照片角度有刁钻的要求。

正是凭借这一创意,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。

改进式EG3D合成人像,光线新闻单独处置

下面就来看一下FaceLit具体是怎么完成头像合成的。

总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。

早期的三维人像合成工具在转变过程中抑或产生形变。

而爆火的NeRF经过将场景拆分成具体因素,抬高了3D图像合成效果,改善了这一问题。

但苹果团队认为,在可控性方面,NeRF仍存有不足之处。

于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。

EG3D经过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。

苹果团队对标准的EG3D训练方式进行了扩充,并将之转化成了FaceLit框架。

FaceLit与传统EG3D渲染流程对比图

标准的ED3G使用相机位置p参数看成基本输入参数。

在建立GAN2操作时,苹果在EG3D的基础上加大了光照参数l

苹果选择了经过球形谐波方式简化后的Phong反射模型算作处理光源的物理基础。

光照参数l就是在这一基础之上独立处置得到的。

在自然界中,反射包括镜面反射漫反射两种形式。

不同镜面反射率条件下的效果对比

因此,苹果在ED3G模型中增进了镜面反射解码器和漫反射解码器。

它们替代了允许干脆得到颜色c、密度σ数据的三平面解码器

反射解码器流程示意图

通过对GAN2产生的数据进行有一次解码,可以得到镜面反射率ks和漫反射率kd

然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。

最终,FaceLit以与三平面解码器相仿的参数(c,w,σ)渲染图像,并进行分辨率优化。

有的放矢设计训练策略,数据无需人工标注

生成框架已有,那就来到训练阶段,其特点在于训练流程中无需人工标注。

方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。

对于不同的数据集,苹果使用了不同的训练方式。

FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提升分辨率有一次进行。

对于网罗2万数据量的CelebA-HQ,训练不需要分阶段进行。

而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。

定性地看,训练结果在机位、光源和反射高光等方面都有出色的涌现,图中的细节也有所增强。

FaceLit生成的头像(左侧四列)唇齿部位的细节进行了明显重构

定量结果同样阐明,FaceLit在FID、KID等指标上均优于包含标准EG3D在内的传统生成方式。

在使用FFHQ看成训练集的条件下,各生成方式的浮现如下表,不难看出FaceLit占有最低的FID和KID值。

而相比于英伟达的StyleGAN2,FaceLit的涌现仍然出色:

光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。

网友:人们低估了苹果AI

快讯发送后,便有网友认为“这是对更重磅产品的预热”。

更有网友直接推测,FaceLit的显示标示着人工智能将进军AR和VR领域,苹果的融合现实将最后兑现商用……

也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式公布。

针对FaceLit自身,也有网友表态,除了LLM,其他都是浮云,他们(苹果)假设不开发LLM,就没有将来。

但这位网友同时也说,苹果大概曾经在做(LLM)了。

相应的,也有网友称人们“低估了苹果在AI领域的深度”。

所以各位网友对苹果在AI领域还有什么样的期望呢?

论文地址:

https://arxiv.org/abs/2303.15437

GitHub地址:

https://github.com/apple/ml-facelit

参照链接:

https://twitter.com/AlphaSignalAI/status/1648361623004774400

(投诉)

(责任编辑:admin)