证件照生成
语义软分割。语义软分割(Semantic Soft Segments),旨在精确表示图像不同区域间的软过渡. 类似于磁力套索(magnetic lasso) 和魔术棒(magic wand) 的功能. 普通语义分割将每个像素分配到一个类,语义软分割中则每个像素有可能分配到多个类,且目标之间的过渡区域平滑,这对于图像编辑是非常重要的。以往这需要专业的PS人员处理,而通过软语义分割,将这个过程实现自动化。
照片风格化。换成油画,卡通等等风格
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。
预测蛋白质形状。AlphaFold 是 DeepMind 开源的人工智能系统,借助 AlphaFold 可以更加准确的预测蛋白质的形状。主要应用于医疗保健和生命科学领域,有可能加速药物的研究与发现。
语音克隆