语音克隆
视频风格转换。将视频中的图像风格转换成其它类别,例如油画风格,卡通风格等等。
图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整
视频生成
检测图内中文。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
改变人体姿势。简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)