让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。
语义软分割。语义软分割(Semantic Soft Segments),旨在精确表示图像不同区域间的软过渡. 类似于磁力套索(magnetic lasso) 和魔术棒(magic wand) 的功能. 普通语义分割将每个像素分配到一个类,语义软分割中则每个像素有可能分配到多个类,且目标之间的过渡区域平滑,这对于图像编辑是非常重要的。以往这需要专业的PS人员处理,而通过软语义分割,将这个过程实现自动化。
生成人脸,编辑人脸。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
用游戏训练自动驾驶。Europilot是一个开源项目,它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器(ETS2)开发自动驾驶算法。使用europilot,可以捕获游戏屏幕输入,并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用:培训或测试。对于培训,europilot可以实时捕获屏幕输入并输出一个numpy数组,同时获取轮盘游戏杆值。为了进行测试,europilot可以创建一个虚拟的操纵杆驱动程序,该驱动程序可以在游戏中识别,并可以通过编程方式控制卡车。使用此操纵杆,您可以创建一个实时推理网络,该实时推理网络将游戏屏幕用作输入,并输出相关的操纵杆命令,例如转向。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。
自动驾驶仿真平台。SMARTS作为首个支持MARL的自动驾驶仿真平台,将提供Simulator Core(快速且灵活地创建RL模拟环境)、Algorithm Library(集成主流的强化学习算法)、Multi-Agent Trainer(支持大多数多智能体训练范式)、Policy Zoo(支持对社会车辆的实例化)和 Scenario Studio(支持灵活的场景设置),方便参赛者在比赛过程中实现对车辆动力学行为的真实建模,并利用丰富的交通场景进行研究和应用。