deepseek开源
人物图生成。利用多张照片作为身份ID,获取人物特征,然后根据描述生成一个新的、个性化的人物图像。
目标检测。YOLOv6的精度与速度都远超 YOLOv5 和 YOLOX。
拍照做题。输入一张包含数学计算题的图片,输出识别出的数学计算式以及计算结果。 请查看系统文档说明来运行程序。注意,这是一个半开源的项目,目前上传的版本只能处理简单的一维加减乘除算术表达式(如果想要识别更加复杂的表达式,可以参考数学公式识别的论文)。可以参考的代码是前面字符识别部分以及整个算法处理框架。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
视频风格转换。将视频中的图像风格转换成其它类别,例如油画风格,卡通风格等等。
图像语义编辑。例如将眼睛与嘴巴放大,对马的胖瘦调整