AINav.net AINav.net AINav.net AINav.net
  • 学习|竞赛网站
  • AI产品精选
  • 开源项目精选(若github打不开,请多试几次)
  • 数据集精选
  • 开发工具精选
  • 点击推荐好网站
AINav.net AINav.net
  • 将本站设为主页
常用
搜索
工具
社区
生活
求职

    NLP数据

    中文语料
    中文语料

    大规模中文自然语言处理语料

    433 0
    NLP数据
    古诗词数据库
    古诗词数据库

    最全诗词集合,唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。

    578 0
    NLP数据
    THUOCL
    THUOCL

    中文词库分词。是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库,词表来自主流网站的社会标签、搜索热词、输入法词库等。THUOCL具有以下特点: 包含词频统计信息DF值(Document Frequency),方便用户个性化选择使用。 词库经过多轮人工筛选,保证词库收录的准确性。 开放更新,将不断更新现有词表,并推出更多类别词表。该词库可以用于中文自动分词,提升中文分词效果。

    554 0
    NLP数据
    wikitext
    wikitext

    长时依赖词库。包含1亿个词汇的英文词库数据,这些词汇是从Wikipedia的优质文章和标杆文章中提取得到的。每个词汇还同时保留产生该词汇的原始文章,这尤其适合当需要长时依赖(longterm dependency)自然语言建模的场景。

    450 0
    NLP数据

    分类

    • AI资讯
    • 未分类

               Copyright © 2021 AINav.net   京ICP备19040815号-4

      
    登录
    注册|忘记密码?