识别图中文字。
物体检测项目。 输入一张图片,输出其中有哪些的物体对象,以及每个对象的位置。其最大的特点是运行速度很快,可以用于实时系统。
图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
涂鸦变实物。我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。 在AI界这叫做叫“语义布局”。
人工智能换脸。
人脸属性替换。例如换个鼻子嘴巴,甚至肤色和性别,通过StarGAN v2可是轻松的识别人脸属性, 并精准替换,肉眼都难以发现破绽。