开源项目精选（若github打不开，请多试几次）

chineseocr

检测图内中文。

标签：文字检测项目视觉数据

链接直达手机查看

检测图内中文。

数据统计

图像理解。为了使计算机理解图像，数据集中的图片被划分成一个个区域，每个区域都有与其对应的一句自然语言描述。共108,077张图。

目标分割数据。DAVIS(Densely-Annotated VIdeo Segmentation)数据集是视频目标分割(VOS)任务中最重要的数据集之一。

自动驾驶数据。是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据，每张图像中最多达15辆车和30个行人，还有各种程度的遮挡与截断。

手写数字图片。训练集样本60,000个，测试集样本10,000个。由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的工作人员。

最大图片集合。大约1500万张图片，2.2万个分类，一般情况下只用子数据集就可以了。。每张都经过了严格的人工标注。数据集还是按照WordNet框架组织的，WordNet模拟的就是人类对事物的识别系统。

城市街道场景。是关于城市街道场景的语义理解图片数据集。它主要包含来自50个不同城市的街道场景，拥有5000张在城市环境中驾驶场景的高质量像素级注释图像。此外，它还有20000张粗糙标注的图像。

您必须登录才能参与评论！

立即登录

暂无评论...