拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维……
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
用游戏训练自动驾驶。Europilot是一个开源项目,它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器(ETS2)开发自动驾驶算法。使用europilot,可以捕获游戏屏幕输入,并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用:培训或测试。对于培训,europilot可以实时捕获屏幕输入并输出一个numpy数组,同时获取轮盘游戏杆值。为了进行测试,europilot可以创建一个虚拟的操纵杆驱动程序,该驱动程序可以在游戏中识别,并可以通过编程方式控制卡车。使用此操纵杆,您可以创建一个实时推理网络,该实时推理网络将游戏屏幕用作输入,并输出相关的操纵杆命令,例如转向。
年龄编辑项目。高分辨率的人脸年龄编辑。人脸年龄编辑则不仅可以做人脸老化,还能“返老还童”。
视频运动放大。视频运动放大技术是一种从视频到视频的滤波处理,可以使我们能够看到在视频中肉眼看不到的小的运动,例如振动飞机机翼的动作,或者在风的影响下摇摆的建筑物等。
P图神器。通过简单涂鸦,就可以调整图中人物的眉毛、鼻梁、脸型、嘴型眼睛大小,当然头发也是可以生成的(光头变成浓密秀发~),另外还可以生成耳饰。
识别图中文字。