时尚服饰项目。这是香港中文大学开源的一款专注于时尚服饰领域的分析工具。其目前含有的主要功能: 1)服饰属性识别; 识别服饰类别和款式。2)服饰检索; 查找与其类似的商品图……
物体检测项目。 输入一张图片,输出其中有哪些的物体对象,以及每个对象的位置。其最大的特点是运行速度很快,可以用于实时系统。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。
识别图中文字。
用游戏训练自动驾驶。Europilot是一个开源项目,它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器(ETS2)开发自动驾驶算法。使用europilot,可以捕获游戏屏幕输入,并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用:培训或测试。对于培训,europilot可以实时捕获屏幕输入并输出一个numpy数组,同时获取轮盘游戏杆值。为了进行测试,europilot可以创建一个虚拟的操纵杆驱动程序,该驱动程序可以在游戏中识别,并可以通过编程方式控制卡车。使用此操纵杆,您可以创建一个实时推理网络,该实时推理网络将游戏屏幕用作输入,并输出相关的操纵杆命令,例如转向。
视觉工具名库。包含了很多计算机视觉领域的功能,例如人脸识别,目标检测,轨迹跟踪,手势识别,图像实例分割等等
涂鸦变实物。我们画一幅涂鸦,用颜色区分每一块对应着什么物体,它就能照着我们的空间布局思路,合成以假乱真的真实世界效果图。 在AI界这叫做叫“语义布局”。