语音克隆
人物图生成。利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
改变人体姿势。简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)
图片视频无损放大。可以将图片以及视频变高清。
deepseek开源
涂鸦变实物。我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。 在AI界这叫做叫“语义布局”。
给视频加字幕