视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的Re……
使相片变高清
生成人脸,编辑人脸。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
去除人脸马赛克。眼中有码,心中无码”是境界,“图上有码,脑补解码”就是PULSE算法了。 PULSE 算法目前只支持人脸的马赛克“去除”,因为训练数据都是人脸。
视觉工具名库。包含了很多计算机视觉领域的功能,例如人脸识别,目标检测,轨迹跟踪,手势识别,图像实例分割等等
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。