视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
视频运动放大。视频运动放大技术是一种从视频到视频的滤波处理,可以使我们能够看到在视频中肉眼看不到的小的运动,例如振动飞机机翼的动作,或者在风的影响下摇摆的建筑物等。
给老照片上色。
图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
AI辅助绘画。随便画上几笔,就是张漂亮的作品。
视觉工具名库。包含了很多计算机视觉领域的功能,例如人脸识别,目标检测,轨迹跟踪,手势识别,图像实例分割等等