AINav.net 一个属于AI人的导航网站

拍照做题。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

BigTransfer

视觉迁移模型。谷歌发文介绍了其BigTransfer（BiT），称其为目前最先进的预训练模型，在分类问题中仅需要每个类少量几个样本即可达到极其优秀的性能。事实上，在ImageNet预训练的ResNet50系列模型是当前的工业标准，用于提取图像特征。在谷歌在论文 BigTransfer (BiT) 中分享的模型则可以轻松打败ResNet50，尽管数据量很少。

GFPGAN

使相片变高清

navigan

图像语义编辑。例如将眼睛与嘴巴放大，对马的胖瘦调整

music-auto_tagging-keras

音乐分类。这是一个给音乐增加标签的开源项目。目前系统中已包含的标签： [“摇滚”，“流行”，“另类”，“独立”，“电子”，“女歌手”， “舞蹈”，“ 00s”，“另类摇滚”，“爵士”，“美丽”，“金属”， “放松”，“男歌手”，“经典摇滚”，“灵魂”，“独立摇滚”， “音乐”，“电子音乐”，“80年代' ，'民间'，'90年代'，'chill'，'instrumental'， 'punk'，'oldies'，'blues'，'hard rock'，'ambient'，'acoustic，'experimental'， 'female vocalist'，'guitar'，'Hip-Hop ”，“ 70年代”，“派对”，“国家”，“轻松聆听”， “性感”，“醒目”，“放克”，“电子”，“重金属”，“渐进摇滚”， “ 60年代”，“ rnb”，“独立流行音乐”，“悲伤”，“房子”，“快乐” ]

labelU

标注工具

OpenVoice

数据统计

相关导航

暂无评论