开源项目精选（若github打不开，请多试几次）

PaddleOCR

从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品；Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称……

标签：视觉项目

链接直达手机查看

从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品；Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。

数据统计

相关导航

AdaIN-style

照片风格化。换成油画，卡通等等风格

mathAI

拍照做题。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

DeOldify

给老照片上色。

BigTransfer

视觉迁移模型。谷歌发文介绍了其BigTransfer（BiT），称其为目前最先进的预训练模型，在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上，在ImageNet预训练的ResNet50系列模型是当前的工业标准，用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50，尽管数据量很少。

Wav2Lip

让视频换成你想说的话。他的功能，就是上传一段视频，再上传一段音频，算法会让视频中的人物说出音频文件的内容。通过机器学习让发音与嘴型进行匹配。

SPADE

涂鸦变实物。我们画一幅涂鸦，用颜色区分每一块对应着什么物体，它就能照着我们的空间布局思路，合成以假乱真的真实世界效果图。在AI界这叫做叫“语义布局”。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...