让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。
识别图中文字。
拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。
用游戏训练自动驾驶。Europilot是一个开源项目,它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器(ETS2)开发自动驾驶算法。使用europilot,可以捕获游戏屏幕输入,并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用:培训或测试。对于培训,europilot可以实时捕获屏幕输入并输出一个numpy数组,同时获取轮盘游戏杆值。为了进行测试,europilot可以创建一个虚拟的操纵杆驱动程序,该驱动程序可以在游戏中识别,并可以通过编程方式控制卡车。使用此操纵杆,您可以创建一个实时推理网络,该实时推理网络将游戏屏幕用作输入,并输出相关的操纵杆命令,例如转向。
去除图中的雨。图像中雨水条纹会严重降低能见度,导致许多当前的计算机视觉算法无法工作,比如在自动驾驶场景下图像去雨就变得非常重要。
图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。