车道数据集。OpenLane 是迄今为止第一个真实世界和规模最大的 3D 车道数据集。我们的数据集从公共感知数据集 Waymo Open Dataset 中收集有价值的内容,并为 1000 个路段提供车道和……
最大自动驾驶数据集。包括了1000万张无标注图片以及2万张带标注图片。SODA10M数据集收集了不同城市在不同天气条件、时间段以及位置的场景。 晴天雨天、白天夜晚、城市高速园区…… 更重要的是,覆盖面很广。 1000万张无标注图片来自32个城市,囊括了国内大部分地区。
蛋白质结构。98.5%的人类蛋白质结构被Google AlphaFold2预测出来了! 而且还做成了数据集,全部免费开放!
伪造检测。真实感合成技术的快速发展已经达到了一个临界点,真实图像和操纵图像之间的边界开始模糊。因此,基准测试和推进数字伪造分析已成为一个紧迫的问题。然而,现有的人脸伪造数据集要么多样性有限,要么只支持粗粒度分析。为了应对这种新出现的威胁,我们构建了 ForgeryNet 数据集,这是一个非常大的人脸伪造数据集,在图像和视频级数据中具有统一的注释,跨越四个任务:1)图像伪造分类,包括双向(真/假)、三个-way(真/假,带有身份替换的伪造方法/带有身份保留的伪造方法的假)和 n-way(真实和 15 种各自的伪造方法)分类。 2)空间伪造定位,将伪造图像的操纵区域与其相应的源真实图像进行分割。 3)视频伪造分类,它重新定义了视频级别的伪造分类,其中操纵帧位于随机位置。这项任务很重要,因为现实世界中的攻击者可以自由地操纵任何目标帧。 4) Temporal Forgery Localization,对被操作的时间段进行定位。 ForgeryNet 在数据规模(290 万张图像,221,247 个视频)、操作(7 个图像级方法、8 个视频级方法)、扰动(36 个独立和更多混合扰动)方面是迄今为止最大的公开可用的深度人脸伪造数据集) 和注释(630 万个分类标签、290 万个操作区域注释和 221,247 个临时伪造片段标签)。我们对现有的人脸取证方法进行了广泛的基准测试和研究,并获得了一些有价值的观察结果。
长时依赖词库。包含1亿个词汇的英文词库数据,这些词汇是从Wikipedia的优质文章和标杆文章中提取得到的。每个词汇还同时保留产生该词汇的原始文章,这尤其适合当需要长时依赖(longterm dependency)自然语言建模的场景。
人脸识别。包含了来源于互联网的13233张来自5749个人的人脸图片,其中有1680个人至少有2张图片。
755小时汉语。包含755小时的语音数据,其主要是移动终端的录音数据。邀请来自中国不同重点区域的1080名演讲者参与录制。句子转录准确率高于98%。录音在安静的室内环境中进行。数据库分为训练集,验证集和测试集,比例为51:1:2。诸如语音数据编码和说话者信息的细节信息被保存在元数据文件中。录音文本领域多样化,包括互动问答,音乐搜索,SNS信息,家庭指挥和控制等。还提供了分段的成绩单。该语料库旨在支持语音识别,机器翻译,说话人识别和其他语音相关领域的研究人员。因此,语料库完全免费用于学术用途。