开源项目精选（若github打不开，请多试几次）

Wav2Lip

让视频换成你想说的话。他的功能，就是上传一段视频，再上传一段音频，算法会让视频中的人物说出音频文件的内容。通过机器学习让发音与嘴型进行匹配。

标签：视觉项目

链接直达手机查看

数据统计

相关导航

AdvancedEAST

识别图中文字。

mathAI

拍照做题。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

europilot

用游戏训练自动驾驶。Europilot是一个开源项目，它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器（ETS2）开发自动驾驶算法。使用europilot，可以捕获游戏屏幕输入，并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用：培训或测试。对于培训，europilot可以实时捕获屏幕输入并输出一个numpy数组，同时获取轮盘游戏杆值。为了进行测试，europilot可以创建一个虚拟的操纵杆驱动程序，该驱动程序可以在游戏中识别，并可以通过编程方式控制卡车。使用此操纵杆，您可以创建一个实时推理网络，该实时推理网络将游戏屏幕用作输入，并输出相关的操纵杆命令，例如转向。

RESCAN

去除图中的雨。图像中雨水条纹会严重降低能见度，导致许多当前的计算机视觉算法无法工作，比如在自动驾驶场景下图像去雨就变得非常重要。

navigan

图像语义编辑。例如将眼睛与嘴巴放大，对马的胖瘦调整

pythia

视觉问答项目。什么是视觉问答VQA（Visual Question Answering）？给定一幅图片及与图片相关的问题，系统通过理解图片回答这个问题，它涉及到图像识别和自然语言理解。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...