图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整
腾讯人脸识别开源项目。TFace项目中的算法能力已应用在内外多个业务中,对内广泛支撑了腾讯内部如微信,QQ中的身份识别需求,对外则通过腾讯云服务的形式,提供了ToC、ToB的相关能力,典型应用案例如跨年龄寻人、人脸核身、刷脸支付等。
自动驾驶仿真平台。SMARTS作为首个支持MARL的自动驾驶仿真平台,将提供Simulator Core(快速且灵活地创建RL模拟环境)、Algorithm Library(集成主流的强化学习算法)、Multi-Agent Trainer(支持大多数多智能体训练范式)、Policy Zoo(支持对社会车辆的实例化)和 Scenario Studio(支持灵活的场景设置),方便参赛者在比赛过程中实现对车辆动力学行为的真实建模,并利用丰富的交通场景进行研究和应用。
视觉迁移模型。谷歌发文介绍了其BigTransfer(BiT),称其为目前最先进的预训练模型,在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上,在ImageNet预训练的ResNet50系列模型是当前的工业标准,用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50,尽管数据量很少。
让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。
反美颜系统。美颜就是通过“曲面液化”来达到形状调整的目的的, 只要经过液化的照片,电脑都能找到痕迹,并将其还原。
从图中识别文字。PaddleOCR是百度PaddlePaddle开源框架的代表作品;Github 获得6000多个star! OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。