AI辅助绘画。随便画上几笔,就是张漂亮的作品。
视觉工具名库。包含了很多计算机视觉领域的功能,例如人脸识别,目标检测,轨迹跟踪,手势识别,图像实例分割等等
物体检测项目。 输入一张图片,输出其中有哪些的物体对象,以及每个对象的位置。其最大的特点是运行速度很快,可以用于实时系统。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。
视频风格转换。将视频中的图像风格转换成其它类别,例如油画风格,卡通风格等等。
让动画变高清。例如可以将动漫画面从1080p提升到2160p。