视频生成
涂鸦变实物。我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。 在AI界这叫做叫“语义布局”。
StableDiffusion的Web界面
人脸属性替换。例如换个鼻子嘴巴,甚至肤色和性别,通过StarGAN v2可是轻松的识别人脸属性, 并精准替换,肉眼都难以发现破绽。
去除人脸马赛克。眼中有码,心中无码”是境界,“图上有码,脑补解码”就是PULSE算法了。 PULSE 算法目前只支持人脸的马赛克“去除”,因为训练数据都是人脸。
拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。
视频运动放大。视频运动放大技术是一种从视频到视频的滤波处理,可以使我们能够看到在视频中肉眼看不到的小的运动,例如振动飞机机翼的动作,或者在风的影响下摇摆的建筑物等。