资源 | 机器学习高质量数据集大合辑(附链接)

  • 时间:
  • 浏览:1

没法用于机器学习的开放数据集有那先 呢?大伙儿给大伙儿推荐一份高质量的数据集,那先 数据集已经包含范围广泛(比如 Kaggle),已经非常细化(比如自动驾驶汽车的数据)。

首先,在搜索数据集时,在卡内基·梅隆大学有以下说法:

在机器学习中,寻找数据集也是非常重要的一步。质量高已经相关性高的数据集对模型的训练是非常有帮助的。

 ●  数据集不应该有太大行或列,有时候很容易使用。 ●  数据越干净越好 —— 清洗大型数据集相当耗时。 ●  数据还能够 解答太大有趣的大问题。

数据集查找器

Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平