阿里大模型开源
SD高级界面。ComfyUI 是一个基于节点流程式的stable diffusion AI 绘图工具WebUI。通过将stable diffusion的流程拆分成节点,实现了更加精准的工作流定制和完善的可复现性。但节点式的工作流也提高了一部分使用门槛。 同时,因为内部生成流程做了优化,生成图片时的速度相较于webui又10%~25%的提升(根据不同显卡提升幅度不同),生成大图片的时候不会爆显存,只是图片太大时,会因为切块运算的导致图片碎裂。
检测图内中文。
视频风格转换。将视频中的图像风格转换成其它类别,例如油画风格,卡通风格等等。
视觉问答项目。什么是视觉问答VQA(Visual Question Answering)? 给定一幅图片及与图片相关的问题,系统通过理解图片回答这个问题,它涉及到图像识别和自然语言理解。
年龄编辑项目。高分辨率的人脸年龄编辑。人脸年龄编辑则不仅可以做人脸老化,还能“返老还童”。
让视频换成你想说的话。他的功能,就是上传一段视频,再上传一段音频,算法会让视频中的人物说出音频文件的内容。 通过机器学习让发音与嘴型进行匹配。