给视频加字幕
阿里大模型开源
表情识别。识别开心,悲伤,惊讶等等表情
让动画变高清。例如可以将动漫画面从1080p提升到2160p。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
涂鸦变实物。我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。 在AI界这叫做叫“语义布局”。
StableDiffusion的Web界面