AINav.net 一个属于AI人的导航网站

城市街道场景。是关于城市街道场景的语义理解图片数据集。它主要包含来自50个不同城市的街道场景，拥有5000张在城市环境中驾驶场景的高质量像素级注释图像。此外，它还有20000张粗糙标注的图像。

最全诗词集合，唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人，21050首词。

伪造检测。真实感合成技术的快速发展已经达到了一个临界点，真实图像和操纵图像之间的边界开始模糊。因此，基准测试和推进数字伪造分析已成为一个紧迫的问题。然而，现有的人脸伪造数据集要么多样性有限，要么只支持粗粒度分析。为了应对这种新出现的威胁，我们构建了 ForgeryNet 数据集，这是一个非常大的人脸伪造数据集，在图像和视频级数据中具有统一的注释，跨越四个任务：1）图像伪造分类，包括双向（真/假）、三个-way（真/假，带有身份替换的伪造方法/带有身份保留的伪造方法的假）和 n-way（真实和 15 种各自的伪造方法）分类。 2）空间伪造定位，将伪造图像的操纵区域与其相应的源真实图像进行分割。 3）视频伪造分类，它重新定义了视频级别的伪造分类，其中操纵帧位于随机位置。这项任务很重要，因为现实世界中的攻击者可以自由地操纵任何目标帧。 4) Temporal Forgery Localization，对被操作的时间段进行定位。 ForgeryNet 在数据规模（290 万张图像，221,247 个视频）、操作（7 个图像级方法、8 个视频级方法）、扰动（36 个独立和更多混合扰动）方面是迄今为止最大的公开可用的深度人脸伪造数据集) 和注释（630 万个分类标签、290 万个操作区域注释和 221,247 个临时伪造片段标签）。我们对现有的人脸取证方法进行了广泛的基准测试和研究，并获得了一些有价值的观察结果。

Fruit-Images-Dataset

水果蔬菜数据。包含90483张图，131个种类，100像素。

SODA10M

最大自动驾驶数据集。包括了1000万张无标注图片以及2万张带标注图片。SODA10M数据集收集了不同城市在不同天气条件、时间段以及位置的场景。晴天雨天、白天夜晚、城市高速园区…… 更重要的是，覆盖面很广。 1000万张无标注图片来自32个城市，囊括了国内大部分地区。

MAGICDATA

755小时汉语。包含755小时的语音数据，其主要是移动终端的录音数据。邀请来自中国不同重点区域的1080名演讲者参与录制。句子转录准确率高于98％。录音在安静的室内环境中进行。数据库分为训练集，验证集和测试集，比例为51：1：2。诸如语音数据编码和说话者信息的细节信息被保存在元数据文件中。录音文本领域多样化，包括互动问答，音乐搜索，SNS信息，家庭指挥和控制等。还提供了分段的成绩单。该语料库旨在支持语音识别，机器翻译，说话人识别和其他语音相关领域的研究人员。因此，语料库完全免费用于学术用途。

OpenLane

数据统计

相关导航

暂无评论