从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称……
使图片变高清。优秀的图像超分辨率项目。图像超分辨率是指由一幅低分辨率图像或图像序列恢复出高分辨率图像。
腾讯人脸识别开源项目。TFace项目中的算法能力已应用在内外多个业务中,对内广泛支撑了腾讯内部如微信,QQ中的身份识别需求,对外则通过腾讯云服务的形式,提供了ToC、ToB的相关能力,典型应用案例如跨年龄寻人、人脸核身、刷脸支付等。
用游戏训练自动驾驶。Europilot是一个开源项目,它使用python控制Euro Truck Simulator 2开发自我驾驶算法的工具包。利用流行的欧洲卡车模拟器(ETS2)开发自动驾驶算法。使用europilot,可以捕获游戏屏幕输入,并以编程方式控制模拟器内的卡车。Europilot可以以两种方式之一使用:培训或测试。对于培训,europilot可以实时捕获屏幕输入并输出一个numpy数组,同时获取轮盘游戏杆值。为了进行测试,europilot可以创建一个虚拟的操纵杆驱动程序,该驱动程序可以在游戏中识别,并可以通过编程方式控制卡车。使用此操纵杆,您可以创建一个实时推理网络,该实时推理网络将游戏屏幕用作输入,并输出相关的操纵杆命令,例如转向。
人工智能换脸。
让动画变高清。例如可以将动漫画面从1080p提升到2160p。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。