移除视频人物。可以移除视频中的物体。
AI辅助绘画。随便画上几笔,就是张漂亮的作品。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。
时尚服饰项目。这是香港中文大学开源的一款专注于时尚服饰领域的分析工具。其目前含有的主要功能: 1)服饰属性识别; 识别服饰类别和款式。2)服饰检索; 查找与其类似的商品图。3)服饰解析与分割 4)服饰特征点定位。5)服饰搭配与推荐。该库也提供了大量该领域数据集。
视频风格转换。将视频中的图像风格转换成其它类别,例如油画风格,卡通风格等等。
自动驾驶仿真平台。SMARTS作为首个支持MARL的自动驾驶仿真平台,将提供Simulator Core(快速且灵活地创建RL模拟环境)、Algorithm Library(集成主流的强化学习算法)、Multi-Agent Trainer(支持大多数多智能体训练范式)、Policy Zoo(支持对社会车辆的实例化)和 Scenario Studio(支持灵活的场景设置),方便参赛者在比赛过程中实现对车辆动力学行为的真实建模,并利用丰富的交通场景进行研究和应用。