我的编程空间,编程开发者的网络收藏夹
学习永远不晚
位置:首页-资讯-运维

大数据有哪些高质量开源数据集发布?

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

大数据有哪些高质量开源数据集发布?

计算机视觉项目:10个高质量开源数据集发布。人工智能的定义可以分为两部分,即“ 人工”和“ 智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。

计算机视觉正在加速行业中几乎每个领域的发展。 在计算机视觉技术的帮助下,组织正在彻底改变机器以前的工作方式。 现在,全球各地的大型技术都在利用计算机视觉技术领域,例如医疗保健和自动驾驶等。 为了建立强大的计算机视觉深度学习模型,必须在训练阶段应用高质量的数据集。

大数据有哪些高质量开源数据集发布_AI课程_人工智能视频_机器学习课程_编程学习网

在本文中,我们将列出10个可用于Computer Vision项目的高质量数据集。

1 | CIFAR-10

CIFAR-10是Alex Krizhevsky,Vinod Nair和Geoffrey Hinton收集的一种流行的计算机视觉数据集。 该数据集用于对象识别,由10类60,000张32×32彩色图像组成,每类6,000张图像。 它分为五个训练批次和一个测试批次,每个批次具有10,000张图像,这意味着有50,000个训练图像和10,000个测试图像。

2 | Cityscapes

Cityscapes是Computer Vision项目的开源大规模数据集,其中包含来自50个不同城市的街道场景中记录的各种立体视频序列。它包括5,000个帧的高质量像素级注释,以及20,000个弱注释帧的较大集合。 该数据集主要用于训练深度神经网络和评估视觉算法对语义城市场景理解的主要任务的性能。

3 | Fashion MNIST

Fashion-MNIST是用于Computer Vision的图像数据集,包含60,000个示例的训练集和10,000个示例的测试集。 在此数据集中,每个示例都是一个28×28灰度图像,与来自10个类别的标签关联。 有一个基于Scikit-learn的自动基准测试系统,该系统涵盖129个具有不同参数的分类器。

4 | ImageNet

ImageNet是计算机视觉项目最受欢迎的数据集之一,它提供了一个可访问的图像数据库,该数据库根据WordNet层次结构进行组织。WordNet中有超过100,000个同义词集,其中ImageNet提供平均1,000个图像来说明WordNet中的每个同义词集。 它为WordNet层次结构中的大多数概念提供了数千万个干净排序的图像。

5| IMDB-Wiki Dataset

IMDB-Wiki数据集是使用性别和年龄标签进行训练的最大的开放式人脸图像数据集之一。此数据集中总共有523,051张面部图像,其中从IMDB的20,284名名人和维基百科的62,328名名人获得了460,723张面部图像。

6 | Kinetics-700

Kinetics-700是YouTube视频URL的大规模高质量数据集,其中包括各种以人为中心的动作。 数据集包括大约650,000个视频剪辑,涵盖700个人类动作类,每个动作类至少包含600个视频剪辑。 在这里,每个剪辑持续约10秒钟,并标有一个类别。

7 | MS Coco

COntext中的COCO或Common Objects是大规模的对象检测,分割和字幕数据集。 数据集包含91个对象类型的照片,这些照片易于识别,并且在328k图像中总共有250万个带标签的实例。

8| MPII Human Pose Dataset

MPII Human Pose数据集用于评估关节式人体姿势估计。 该数据集包含约25K图像,其中包含超过4万名带注释的人体关节的人。 在这里,每张图片都是从YouTube视频中提取的,并带有未标注帧之前的an和an。 总体而言,数据集涵盖410种人类活动,并且每个图像都带有活动标签。

9| Open Images

此Open Images数据集是现有的最大的带有对象位置注释的数据集之一。 它由大约900万幅图像组成,这些图像带有图像级标签,对象边界框,对象分割蒙版和视觉关系。 数据集包含190万幅图像上600个对象类别的1600万个边界框。

10| The 20BN-something-something Dataset V2

20BN-Something-Something数据集是大量带有密集标签的视频剪辑的集合,这些视频剪辑向人们展示了人类对日常对象执行的预定义基本动作。 它是由大量的人群工作人员创建的,它允许ML模型对物理世界中发生的基本动作有更细致的了解。 视频总数包括220,847,其中168,913是训练集,24,777是验证集,27,157是测试集。

Model Play是面向全球开发者的AI模型资源平台,内置多样化AI模型,与钛灵AIX(一款集计算机视觉与智能语音交互两大核心功能为一体的人工智能硬件)结合,基于Google开源神经网络架构及算法,构建自主迁移学习功能,无需写代码,通过选择图片、定义模型和类别名称即可完成AI模型训练。

 
著名的美国斯坦福大学人工智能研究中心尼尔逊教授对 人工智能下了这样一个定义:“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”而另一个美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的 智力才能胜任的工作,也就是研究如何应用计算机的软 硬件来模拟人类某些智能行为的基本理论、方法和技术。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

大数据有哪些高质量开源数据集发布?

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

大数据有哪些高质量开源数据集发布?

编程学习网:计算机视觉正在加速行业中几乎每个领域的发展。 在计算机视觉技术的帮助下,组织正在彻底改变机器以前的工作方式。
大数据有哪些高质量开源数据集发布?

编程热搜

  • 人工智能你要知道的那些事
    编程学习网:早在1g时代我们只能接打电话。2g时代可以打电话发短信,玩早期的qq,但网络十分不稳定。3g时代带给我们很大的改变就是宽带上网,视频通话,看视频,听歌玩游戏。那时的人们认为4g无用,认为不会有什么改变,但当4g出来时我们才发现这是一次质的飞跃。
    人工智能你要知道的那些事
  • 人工智能无人机管制到底有多难?
    编程学习网:近日,一段“重庆网红列车遭无人机撞击逼停”的视频,在网络热传。
    人工智能无人机管制到底有多难?
  • 人工智能与人类
    欢迎各位阅读本篇,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本篇文章讲述了人工智能与人类,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    人工智能与人类
  • 两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
    公共集群的机器负载分布不均衡的问题,业务的查询和流量不可控等各种各样的问题,要节省机器资源就一定会面对这种各种各样的问题,除非土豪式做法,每个业务都拥有自己的机器资源,这里面有很多很多颇具技术挑战的事情。
    两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
  • 关于OpenStack的架构详细讲解
    欢迎各位阅读本篇文章,OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。本篇文章讲述了关于OpenStack的架构详细讲解,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    关于OpenStack的架构详细讲解
  • AI &神经网络
    欢迎各位阅读本篇,本篇文章讲述了AI &神经网络,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。神经网络内容丰富,反映了当前国内外该领域的最新研究成果和动向,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    AI &神经网络
  • 人工智能对于网络安全的优缺点
    编程学习网:如今,产生的数据比以往任何时候都要多。由于数据分析工具的发展,各行各业的组织都更加重视大数据的收集和存储。
    人工智能对于网络安全的优缺点
  • Bash 初学者系列 7:bash 中的条件语句(if else)
    今天我们介绍一下如何在 bash 中使用条件语句。
    Bash 初学者系列 7:bash 中的条件语句(if else)
  • 人工智能机器学习的重要趋势是什么?
    编程学习网:在竞争日益激烈的技术市场中,从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是,人工智能行业发展如此之快,以至于很难跟踪最新的研究突破和成就,甚至很难应用科学成果来实现业务成果。
    人工智能机器学习的重要趋势是什么?
  • 人工智能为什么会觉得Matplotlib用起来困难?
    编程学习网:Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。
    人工智能为什么会觉得Matplotlib用起来困难?

目录