去除图中的雨。图像中雨水条纹会严重降低能见度,导致许多当前的计算机视觉算法无法工作,比如在自动驾驶场景下图像去雨就变得非常重要。
小图无损放大。
让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。
生成人脸,编辑人脸。
拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。
时尚服饰项目。这是香港中文大学开源的一款专注于时尚服饰领域的分析工具。其目前含有的主要功能: 1)服饰属性识别; 识别服饰类别和款式。2)服饰检索; 查找与其类似的商品图。3)服饰解析与分割 4)服饰特征点定位。5)服饰搭配与推荐。该库也提供了大量该领域数据集。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。