MNBVC

2年前发布 20,612 0 0

中文语料集开源项目

收录时间:
2023-09-21
MNBVC中文语料集开源项目
MNBVC数据集(NLP语料数据集)不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据均来源于互联网搜集。
目前总数据量7984GB,目标是达到chatGPT的40T数据,目前进度19.96%。

TKTOC跨境导航将时刻关注并搜集TikTok最新风向、实战干货、变现玩法等,欢迎扫码关注公众号,获取更多跨境电商资讯。

TKTOC跨境导航

Ai出海派

数据统计

相关导航