语音克隆
给视频加字幕
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
使图片变高清。优秀的图像超分辨率项目。图像超分辨率是指由一幅低分辨率图像或图像序列恢复出高分辨率图像。
阿里大模型开源
改变人体姿势。简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)
使相片变高清