数据集资源中心


为世界级人工智能应用团队创建和策划



图像

现成的数据集



我们的高质量可授权数据集跳动您的AI项目

我们提供“现成的”数据集的广泛目录,包括超过250个授权数据集,包括超过11,000小时的音频,超过25,000张图片和超过870万字,跨越80种语言和多种方言。我们的现成数据集旨在有效提高准确性,整体性能,并快速提供高质量的数据集,以满足特定的人工智能程序的需求。在我们的产品中,您可以找到跨多种数据类型的数据集,包括图像、视频、语音、音频和文本。我们不断地建立新的数据集,以满足我们全球客户的需求。


了解更多


图像 图像 图像




图像

开源公众数据集


我们的数据科学家对您的人工智能项目的推荐


机器学习和人工智能应用需要大量的数据训练。您可以从我们推荐的资源中搜索要访问,修改,重用和共享的打开数据集。使用这些公共可用的数据集来影响AI和ML应用程序的开发,或者如果您希望在解决真实数据集之前将一个简单的数据集进行基准测试或比较不同的算法。这些打开的数据集是考虑访问组织范围之外的数据的很好的选择。


数据集发现者



图像
使用Kaggle来查找数据集,探索和构建模型,并与其他数据科学家和机器学习工程师一起工作。探索和分析50000多个公共数据集,从骨骼x光片到拳击比赛的结果。
了解更多
图像
通过可搜索的界面从UC Irvine探索超过500个计算机学习存储库的数据集。在许多主题中的数据集范围,在大小范围内各不相同,从少数案例(或“实例”)高达4300万,并且从1或2个变量(或“属性”)到超过一百万个变量。
了解更多


计算机视觉



计算机视觉通过模拟人类视觉系统的复杂性,使计算机能够以与人类相同的方式识别和处理图像和视频中的物体。在图像应用程序中利用机器学习,如使自动驾驶汽车能够了解周围环境、面部识别应用程序、增强现实和混合现实或在医疗保健领域通过x射线和MRI扫描发现症状的自动化任务。使用丰富的计算机视觉数据集建立一个健壮的计算机视觉模型。


图像
使用1000+高质量的开放数据集加速AI开发。从50多个应用方案中选择30+注释类型和10多个数据格式。
了解更多
图像
这些数据集包括识别对象来重建3D房间的各种主题,从查找视频中的一个人来识别照片中的衬衫。数据集可以按发布的日期或主题进行排序,用户可以使用关键字搜索,以找到适合其需求的图像。
了解更多
图像
使用这些开放数据集来构建面部识别应用程序、虚拟现实小工具、感官检测、全息成像等等。
了解更多
图像
超过3,000台机器学习数据集。通过任务和模态查找数据集,比较使用时间,浏览基准等。
了解更多
图像
计算机视觉机器学习模型的开源数据集横跨广泛的领域——动物、桌面游戏、自动驾驶汽车、医学、热成像、无人机图像,甚至合成数据。您可以免费下载任何格式的图像和注释:VOC XML、COCO JSON、YOLOv3平面文本文件,甚至TFRecords。
了解更多


演讲语料库



录制和转录新的语音语料库来创建声学模型和训练语音识别引擎可能是耗时和昂贵的。使用开放的语音音频文件和文本转录数据库,以快速和廉价地构建转录语音orpora,包含许多发言者在各种声学条件下的话语。


图像
openslr的中央地点,OpenSLR主持言语和语言资源,例如培训语音识别,以及与语音识别有关的软件。
了解更多

烛台


一个用于自动语音识别(ASR)和文本到语音(TTS)的语音语料库集合。
了解更多

EdResson.


DataSet具有71,358个单词总数,具有13,311个不同的单词,从单个扬声器的语音大约10小时和28分钟,记录在48kHz,总共包含3,632个波形的音频文件。音频文件范围为0.67到50.08秒。
了解更多
图像
旨在提供用于获取声学语音知识的语音数据和自动语音识别系统的开发和评估。总共包含6300个句子,每次来自美国8个主要方言区域的630名扬声器中有10个句子。
了解更多

voxceleb.


从上传到YouTube的访谈视频中提取的由人类语言短片段组成的视听数据集。该数据集包含7000多个扬声器,100万多个语音和2000多个小时的音频和视频。
了解更多

msang


建立推特语料库的目的是代表和分析针对意大利一些少数群体的仇恨言论:尤其是移民,也包括穆斯林和罗姆人。包含tweets的ID和注释。
了解更多

voxforge.


转录用于语音识别发动机的演讲;分类并提供所有提交的音频文件(语音语料库)和声学模型。
了解更多

homink


韩国人阅读了国立韩国语研究院(NIKL)提供的120小时左右的语音语料库。
了解更多

siddiquelatif


Urdu DataSet包含从Urdu Talk节目收集的Urdu演讲的情感话语。它包含400个基本情绪的话语:愤怒,快乐,中性和情感。有38个发言者(27名男性和11名女性)。
了解更多
图像
常见的语音数据集是一个开源数据集,目前包含超过7,000小时的60种验证时间,包括可以帮助培训语音识别发动机的准确性的年龄,性和口音等人口统计元数据。DataSet中的每个条目都包含一个唯一的MP3和相应的文本文件。
了解更多
图像
一个大型的句子和翻译数据库,以查看单词如何在句子的上下文中使用的例子。
了解更多
图像
由音频谈话和他们的转录,数据集包含1495个音频演讲,在NIST球体格式(SPH),1495个成绩单以STM格式,用发音(159,848条目)和语言建模的单格式数据的字典。
了解更多


图像

数据收集



如果需要更多的自定义的数据集对于特定的用例,我们提供数据收集作为一个独立的服务等多组分的可交付成果的一部分作为一个ASR语音数据库,通常包括音频数据、转录、发音词典,和一个特定于语言的文档或一个带注释的图像数据集。我们的数据收集服务涵盖各种数据类型和收集方法,以满足您独特的数据需求。

了解更多


图像 图像 图像