
产品目录
虽然开放数据或公共数据集很方便,但我们提供了一个广泛的“现成的”目录,250多个授权数据集,跨越80种语言,跨越多种方言,用于各种常见的AI用例。我们很高兴地宣布30多个新的数据集,为我们的客户提供即时价值。在我们的产品中,您将发现用于语音识别的数据集,用于机器学习算法的学习数据集,所有这些都是使用最先进的可用数据科学创建的。

速度
立即提供支持您的AI / ML项目

成本效益
授权数据集比自定义数据收集更经济

专业知识
20多年的数据收集体验

支持所有数据类型
图像、视频、语音、音频和文本

规模
提供适量的数据以有效培训您的模型

质量
提高质量,最大限度地减少AI型号的偏差
数据集名称 | 产品类别 | 常用案件 | 记录装置 | 单位 |
---|
数据集名称 | 产品类别 | 常用案件 | 记录装置 | 单位 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
135 | 文本 | ASR, TTS,语言建模 | N / A. | 12000字 | 添加引用 | sqi_ALB_PHON | Appen Global. | 发音字典 | 阿尔巴尼亚 | 阿尔巴尼亚 | N / A. | N / A. | N / A. | N / A. | 12,000 | N / A. | 文本 | 阿尔巴尼亚语发音词典 | ||
136 | 文本 | ASR, TTS,语言建模 | N / A. | 45,000个字 | 添加引用 | 阿穆埃斯丰 | Appen Global. | 发音字典 | 阿姆哈里克 | 埃塞俄比亚 | N / A. | N / A. | N / A. | N / A. | 45000年 | N / A. | 文本 | 阿姆哈拉语(埃塞俄比亚)发音词典 | ||
141 | 文本 | ASR, TTS,语言建模 | N / A. | 11,000字 | 添加引用 | ara_DZA_PHON | Appen Global. | 发音字典 | 阿拉伯 | 阿尔及利亚 | N / A. | N / A. | N / A. | N / A. | 11,000 | N / A. | 文本 | 阿拉伯语(阿尔及利亚)的发音词典 | ||
20. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 29个小时 | 添加引用 | EAR_ASR001. | Appen Global. | 会话演讲 | 阿拉伯 | 阿尔及利亚 | 低背景噪音(家庭/办公室) | 496. | 2 | 要求可以办到 | 11,327 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 对于大多数呼叫来说,收集并转账都会收集和转账,对于较少数量的呼叫,只收集了一半的谈话并转录 |
阿拉伯语(阿尔及利亚东部)会话电话 | |
137 | 文本 | ASR, TTS,语言建模 | N / A. | 40,000字 | 添加引用 | ara_egy_phon. | Appen Global. | 发音字典 | 阿拉伯 | 埃及 | N / A. | N / A. | N / A. | N / A. | 40,000 | N / A. | 文本 | 阿拉伯语(埃及)发音词典 | ||
114 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 352小时 | 添加引用 | ARE_ASR001_CN | Appen中国 | 脚本演讲 | 阿拉伯 | 埃及 | 低背景噪音(家庭/办公室) | 627. | 1 | 128908年 | 207576年 | 16. | 波 | 数据集包含带有相应文本提示的音频 文本提示不发元音 |
阿拉伯语(埃及)脚本智能手机 | |
139 | 文本 | ASR, TTS,语言建模 | N / A. | 13000个单词 | 添加引用 | ARA_IRQ_POS. | Appen Global. | 词法词典 | 阿拉伯 | 伊拉克 | N / A. | N / A. | N / A. | N / A. | 13,000. | N / A. | 文本 | 阿拉伯语(伊拉克语)辞典部分 | ||
138 | 文本 | ASR, TTS,语言建模 | N / A. | 15000个单词 | 添加引用 | ara_IRQ_PHON | Appen Global. | 发音字典 | 阿拉伯 | 伊拉克 | N / A. | N / A. | N / A. | N / A. | 15000年 | N / A. | 文本 | 人的名字 | 阿拉伯语(伊拉克)发音词典 | |
140 | 文本 | ASR, TTS,语言建模 | N / A. | 48,000个单词 | 添加引用 | ara_LBY_PHON | Appen Global. | 发音字典 | 阿拉伯 | 利比亚 | N / A. | N / A. | N / A. | N / A. | 48000年 | N / A. | 文本 | 阿拉伯语(利比亚)发音词典 | ||
65. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 12个小时 | 添加引用 | MSA_ASR001 | 全球手机 | 脚本演讲 | 阿拉伯 | 突尼斯 | 低背景噪音(家庭/办公室) | 78 | 1 | 4,908 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
阿拉伯语(现代标准阿拉伯语)脚本麦克风 | |
112 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 33个小时 | 添加引用 | ary_asr001. | Appen Global. | 会话演讲 | 阿拉伯 | 摩洛哥 | 低背景噪音 | 180 | 2 | 80,544 | 23,836 | 8. | 一条法律 | 每位演讲者参与1 - 4次对话。扬声器由人口统计文件中记录的唯一的4位扬声器ID标识 抄写是可用的原始脚本和完全可逆的罗马字母版本与伴音词典 产品转录的英文翻译(ARY_MT001, ARY_ASRMT001) |
阿拉伯语(摩洛哥)会话电话 | |
113 | 文本 | Mt,Chatbot,会话ai | N / A. | 80,544个话语 | 添加引用 | ary_mt001 | Appen Global. | 对话翻译 | 阿拉伯 | 摩洛哥 | N / A. | 180 | N / A. | 80,430 | 23,844 | N / A. | 文本 | 提供相应的音频、转录、完全可逆的罗马化转录和发音词典数据(ARY_ASR001、ARY_ASRMT001) | 阿拉伯语(摩洛哥)会话电话翻译 | |
143 | 文本 | ASR, TTS,语言建模 | N / A. | 60,000字 | 添加引用 | ARA_MAR_PHON. | Appen Global. | 发音字典 | 阿拉伯 | 摩洛哥 | N / A. | N / A. | N / A. | N / A. | 60,000 | N / A. | 文本 | 阿拉伯语(摩洛哥)的发音词典 | ||
144 | 文本 | ASR, TTS,语言建模 | N / A. | 40,000字 | 添加引用 | arb_N / A_PHON | Appen Global. | 发音字典 | 阿拉伯 | N / A. | N / A. | N / A. | N / A. | N / A. | 40,000 | N / A. | 文本 | 阿拉伯语(无)发音词典 | ||
115 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 322小时 | 添加引用 | ARS_ASR001_CN. | Appen中国 | 脚本演讲 | 阿拉伯 | 沙特阿拉伯 | 低背景噪音(家庭/办公室) | 227 | 1 | 104574年 | 156282年 | 16. | 波 | 数据集包含带有相应文本提示的音频 文本提示不发元音 300-1000提示每位发言者涵盖一般内容,包括教育,体育,娱乐,旅行,文化和技术 |
阿拉伯语(沙特阿拉伯)脚本智能手机 | |
146 | 文本 | ASR, TTS,语言建模 | N / A. | 17000个单词 | 添加引用 | ARA_SDN_PHON. | Appen Global. | 发音字典 | 阿拉伯 | 苏丹 | N / A. | N / A. | N / A. | N / A. | 17,000. | N / A. | 文本 | 阿拉伯语(苏丹语)发音词典 | ||
145 | 文本 | ASR, TTS,语言建模 | N / A. | 75,000字 | 添加引用 | ara_ARE_PHON | Appen Global. | 发音字典 | 阿拉伯 | 阿拉伯联合酋长国(阿联酋) | N / A. | N / A. | N / A. | N / A. | 75000年 | N / A. | 文本 | 阿拉伯语(阿拉伯联合酋长国(阿联酋))发音词典 | ||
120 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 170小时 | 添加引用 | ARU_ASR001_CN | Appen中国 | 脚本演讲 | 阿拉伯 | 阿拉伯联合酋长国(阿联酋) | 低背景噪音(家庭/办公室) | 133 | 1 | 42,352 | 85775年 | 16. | 波 | 数据集包含带有相应文本提示的音频 文本提示不发元音 |
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本智能手机 | |
70 | 音频 | ASR、虚拟助理 | 手机和固定电话 | 48小时 | 添加引用 | 阿拉伯联合酋长国东方MCA(现代阿拉伯口语) | 细微差别 | 脚本演讲 | 阿拉伯 | 阿拉伯联合酋长国(阿联酋) | 低背景噪音 | 880. | 1 | 43000年 | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 49每个扬声器提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富裕和单词和单词和自动的控制 |
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话 | |
71 | 音频 | ASR、虚拟助理 | 手机和固定电话 | 31个小时 | 添加引用 | OrienTel阿联酋MSA(现代标准阿拉伯语) | 细微差别 | 脚本演讲 | 阿拉伯 | 阿拉伯联合酋长国(阿联酋) | 低背景噪音 | 500 | 1 | 24,500. | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 49每个扬声器提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富裕和单词和单词和自动的控制 |
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话 | |
9. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 86小时 | 添加引用 | cga_asr001. | Appen Global. | 脚本演讲 | 阿拉伯 | 阿拉伯联合酋长国(阿联酋) - 沙特阿拉伯 | 低背景噪音(家庭/办公室) | 150 | 4. | 42,000. | 19245年 | 16. | 一条法律 | 完全转录的声音事件标记源自于speech hdat约定 数据集附有包含所有转录词的发音词典 所有转录都完全压柔 280提示每个发言者包括30个人的名字(名和姓)从一组15,10个单一孤立的数字0-10,8位数字序列(随机生成),200个语音平衡的句子,30 x 10字语音平衡的单词字符串 |
阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风 | |
127 | 文本 | ner,内容分类,搜索引擎 | N / A. | 20774句 | 添加引用 | ARB_NER001. | Appen Global. | 新闻网 | 标准阿拉伯语 | N / A. | N / A. | N / A. | N / A. | 20774年 | 要求可以办到 | N / A. | 文本 | 阿拉伯语NER新闻文本 | ||
147 | 文本 | ASR, TTS,语言建模 | N / A. | 40,000字 | 添加引用 | asm_IND_PHON | Appen Global. | 发音字典 | 阿萨姆人的 | 印度 | N / A. | N / A. | N / A. | N / A. | 40,000 | N / A. | 文本 | assamese(印度)的发音词典 | ||
121 | 音频 | 婴儿监视器,安全和其他消费者应用 | 手机 | 3小时 | 添加引用 | cry_asr001. | Appen中国 | 人体声音 | N / A. | 中国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | N / A. | N / A. | 16. | 波 | 0-3岁婴儿的哭声,每次持续约2分钟。 | 婴儿哭了 | |
4. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 31个小时 | 添加引用 | BAH_ASR001 | Appen Global. | 会话演讲 | 印度尼西亚 | 印尼 | 低背景噪音 | 1,002 | 2 | 30,695 | 11,480 | 8. | 波 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 对于很大比例的电话,只有一半的通话被收集和记录 |
印尼语会话电话 | |
150 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | eus_ESP_PHON | Appen Global. | 发音字典 | 巴斯克 | 西班牙 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 巴斯克(西班牙)的发音词典 | ||
6. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 47小时 | 添加引用 | BEN_ASR001 | Appen Global. | 会话演讲 | 孟加拉语 | 孟加拉国 | 混合(车内、路边、家庭/办公室) | 1,000 | 2 | 108923年 | 17,922 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 |
孟加拉语(孟加拉国)会话电话 | |
151 | 文本 | ASR, TTS,语言建模 | N / A. | 29,000字 | 添加引用 | Ben_ind_Phon. | Appen Global. | 发音字典 | 孟加拉语 | 印度 | N / A. | N / A. | N / A. | N / A. | 29000年 | N / A. | 文本 | 孟加拉语(印度)发音词典 | ||
7. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 38小时 | 添加引用 | bul_asr001. | Appen Global. | 会话演讲 | 保加利亚 | 保加利亚 | 低背景噪音(家庭/办公室) | 217 | 2 | 86,453 | 22342年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
保加利亚语(保加利亚)会话电话 | |
152 | 文本 | ASR, TTS,语言建模 | N / A. | 55000个单词 | 添加引用 | bul_BGR_PHON | Appen Global. | 发音字典 | 保加利亚 | 保加利亚 | N / A. | N / A. | N / A. | N / A. | 55000年 | N / A. | 文本 | 保加利亚语(保加利亚)的发音词典 | ||
111 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 22小时 | 添加引用 | bul_asr002. | 全球手机 | 脚本演讲 | 保加利亚 | 保加利亚 | 低背景噪音(家庭/办公室) | 77 | 1 | 8,674 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
保加利亚语(保加利亚)脚本麦克风 | |
268 | 图像 | 文档处理,文档搜索 | 相机,扫描 | 4362份文件 | 添加引用 | IMG_OCR_B2B. | Appen Global. | 文档OCR | N / A. | N / A. | 混合照明条件 | N / A. | N / A. | N / A. | N / A. | N / A. | jpg. | 包含打印文本的企业对企业文件的扫描和照片。48%优质图片,包括采购订单,付款通知或汇款通知,订单确认和送货单;52%标准质量图像在各种困难条件下的各种类别,包括投诉或退货、发货通知、发货通知单、催收、收货收据、发票、报盘、订单确认、付款凭条、付款通知或汇款通知、采购订单、收据和供应商装载 | 企业对企业打印文本文档OCR | |
269 | 图像 | 文档处理,文档搜索 | 相机,扫描 | 26020份文件 | 添加引用 | IMG\u OCR\u B2C\u其他 | Appen Global. | 文档OCR | N / A. | N / A. | 混合照明条件 | N / A. | N / A. | N / A. | N / A. | N / A. | jpg. | 商家对消费者的扫描和照片以及其他包含文字的类别文件:37%的发票,42%的收据,1%的表格文件,2%的手写表格和文件,2%的菜单,11%的产品标签,2%的海报,3%的路牌。在23个以上地区收集的6种语言:11%的阿拉伯语,43%的英语,4%的法语,4%的德语,24%的西班牙语,14%的俄语 | 业务对消费者/其他文本文档OCR | |
155 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | yue_hkg_pos. | Appen Global. | 词法词典 | 广东话 | 中国 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 传统的 | 粤语(中国)言语字典的一部分 | |
153 | 文本 | ASR, TTS,语言建模 | N / A. | 37000字 | 添加引用 | yue_CHN_PHON | Appen Global. | 发音字典 | 广东话 | 中国 | N / A. | N / A. | N / A. | N / A. | 37000年 | N / A. | 文本 | 简化 | 粤语(中国)发音词典 | |
154 | 文本 | ASR, TTS,语言建模 | N / A. | 40,000字 | 添加引用 | yue_CHN_PHON | Appen Global. | 发音字典 | 广东话 | 中国 | N / A. | N / A. | N / A. | N / A. | 40,000 | N / A. | 文本 | 传统的 | 粤语(中国)发音词典 | |
156 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | cat_ESP_PHON | Appen Global. | 发音字典 | 加泰罗尼亚语的 | 西班牙 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 加泰罗尼亚人(西班牙)的发音词典 | ||
157 | 文本 | ASR, TTS,语言建模 | N / A. | 20,000个字 | 添加引用 | CEB_PHL_PHON. | Appen Global. | 发音字典 | CEBUANO. | 菲律宾 | N / A. | N / A. | N / A. | N / A. | 20,000 | N / A. | 文本 | (菲律宾)发音字典 | ||
265 | 音频 | ASR,会话AI,语音分析 | 手机 | 200小时 | 添加引用 | 外国人_asr001_cn. | Appen中国 | 脚本演讲 | 中文(外国人) | 跨国公司 | 低背景噪音 | 309. | 1 | 16. | 波 | 此数据库包含200小时的外国人从以下国家说中文:阿根廷,埃及,澳大利亚,俄罗斯,菲律宾,哈萨克斯坦,韩国,吉尔吉斯斯坦,加拿大,吉隆坡,肯尼亚,老挝,马来西亚,毛里求斯,美国,蒙古,美国,美国,美国,美国,蒙古,南非,日本,塔吉克斯坦,泰国,土耳其,香港,新加坡,印度,印度尼西亚,越南 没有来自韩国、巴西或未成年人的数据记录。 每一节持续约1小时;句子持续时间在3-10秒之间 内容是个人阅读的形式,同时在家庭/办公环境中记录在移动电话上。 敏感数据和个人信息已被擦洗。 |
中文(外国人)(多国)脚本演讲 | |||
10. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 39小时 | 添加引用 | CRO_ASR001 | Appen Global. | 会话演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 200. | 2 | 要求可以办到 | 23919年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
克罗地亚语(克罗地亚)会话电话 | |
158 | 文本 | ASR, TTS,语言建模 | N / A. | 20,000个字 | 添加引用 | hrv_hrv_phon. | Appen Global. | 发音字典 | 克罗地亚 | 克罗地亚 | N / A. | N / A. | N / A. | N / A. | 20,000 | N / A. | 文本 | 克罗地亚语发音词典 | ||
11. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 11个小时 | 添加引用 | CRO_ASR002 | 全球手机 | 脚本演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 94 | 1 | 4499年 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
克罗地亚语(克罗地亚)脚本麦克风 | |
116 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 263小时 | 添加引用 | CRO\ U ASR003\中国 | Appen中国 | 脚本演讲 | 克罗地亚 | 克罗地亚 | 低背景噪音(家庭/办公室) | 243 | 1 | 73467年 | 136,140 | 16. | 波 | 数据集包含带有相应文本提示的音频 | 克罗地亚脚本智能手机 | |
159 | 文本 | ASR, TTS,语言建模 | N / A. | 50000个单词 | 添加引用 | 塞斯切芬 | Appen Global. | 发音字典 | 捷克语 | 捷克共和国 | N / A. | N / A. | N / A. | N / A. | 50,000. | N / A. | 文本 | 捷克(捷克共和国)发音词典 | ||
12. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 31个小时 | 添加引用 | CZE_ASR001 | 全球手机 | 脚本演讲 | 捷克语 | 捷克共和国 | 低背景噪音(家庭/办公室) | 102 | 1 | 12,425 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
捷克语(捷克共和国)脚本话筒 | |
13. | 音频 | ASR、虚拟助理 | 仅固定电话 | 93小时 | 添加引用 | 捷克语音DAT(e)数据集 | 细微差别 | 脚本演讲 | 捷克语 | 捷克共和国 | 低背景噪音 | 1,000 | 1 | 52000年 | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 52每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,以及语音富裕的单词和句子 |
捷克(捷克共和国)脚本电话 | |
161 | 文本 | ASR, TTS,语言建模 | N / A. | 10万字 | 添加引用 | dan\u DNK\u位置 | Appen Global. | 词法词典 | 丹麦 | 丹麦 | N / A. | N / A. | N / A. | N / A. | 100,000 | N / A. | 文本 | 《丹麦语词典》 | ||
160 | 文本 | ASR, TTS,语言建模 | N / A. | 107000个单词 | 添加引用 | dan_dnk_phon. | Appen Global. | 发音字典 | 丹麦 | 丹麦 | N / A. | N / A. | N / A. | N / A. | 107,000. | N / A. | 文本 | 丹麦语(丹麦)发音词典 | ||
90 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 53小时 | 添加引用 | Speecon丹麦 | 细微差别 | 脚本演讲 | 丹麦 | 丹麦 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
丹麦语(丹麦)脚本麦克风 | |
15. | 音频 | ASR,自动标题,关键字斑点 | 麦克风 | 51小时 | 添加引用 | DAR_BRC001 | Appen Global. | 广播演讲 | 达里语 | 阿富汗 | 低背景噪音(演播室) | N / A. | 1 | 要求可以办到 | 要求可以办到 | N / A. | 波 | 数据集已完全转录和时间戳 目前没有发音词典,但可根据要求开发 数据集主要是语音,不包括音乐和广告 数据类型包括:谈话节目,访谈,新闻广播(不包括锚的新闻读数) |
达里(阿富汗)播出 | |
14. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 40小时 | 添加引用 | DAR_ASR001 | Appen Global. | 会话演讲 | 达里语 | 阿富汗 | 低背景噪音 | 500 | 2 | 要求可以办到 | 11168年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 数据集主要是语音,不包括音乐和广告 |
达里(阿富汗)会话电话 | |
162 | 文本 | ASR, TTS,语言建模 | N / A. | 30000个单词 | 添加引用 | prs_AFG_PHON | Appen Global. | 发音字典 | 达里语 | 阿富汗 | N / A. | N / A. | N / A. | N / A. | 30000年 | N / A. | 文本 | 达里(阿富汗)发音词典 | ||
163 | 文本 | ASR, TTS,语言建模 | N / A. | 20,000个字 | 添加引用 | luo_ken_phon. | Appen Global. | 发音字典 | Doluo. | 肯尼亚 | N / A. | N / A. | N / A. | N / A. | 20,000 | N / A. | 文本 | Dholuo(肯尼亚)发音词典 | ||
258 | 音频 | ASR,会话AI,语音分析 | 记录笔/麦克风 | 84.6小时 | 添加引用 | dongbei_asr001_cn. | Appen中国 | 会话演讲 | 东北方言 | 中国 | 低背景噪音 | 268 | 1 | 16. | 波 | 音频;不包括转录 录音资料覆盖19个地区:沈阳市和平区、沈河区、皇姑区、大东区、铁西区、绿园区、朝阳区、宽城区、二道区、南关区、道里区、南岗区、道外区、平房区、松北区、香坊区、呼兰区、阿城区、双城区 东北郊区口音不包括在内,没有未成年人的记录。 每个录音会话包含20-30分钟的免费对话,在2-5人之间。 敏感数据和个人信息已被擦洗。 |
东北方言(中国)会话用语 | |||
259 | 音频 | ASR,会话AI,语音分析 | 手机 | 75.2小时 | 添加引用 | DONGBEI_ASR002_CN | Appen中国 | 会话演讲 | 东北方言 | 中国 | 低背景噪音 | 185 | 1 | 8. | 波 | 音频;不包括转录 录音资料覆盖19个地区:沈阳市和平区、沈河区、皇姑区、大东区、铁西区、绿园区、朝阳区、宽城区、二道区、南关区、道里区、南岗区、道外区、平房区、松北区、香坊区、呼兰区、阿城区、双城区 东北郊区口音不包括在内,没有未成年人的记录。 每个录音会话包含20-30分钟的免费对话,在2-5人之间。 敏感数据和个人信息已被擦洗。 |
东北方言(中国)会话用语 | |||
91 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 47小时 | 添加引用 | 比利时荷兰语演讲 | 细微差别 | 脚本演讲 | 荷兰的 | 比利时 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
荷兰语(比利时)脚本麦克风 | |
33. | 音频 | ASR、虚拟助理 | 麦克风 | 80小时 | 添加引用 | 佛兰芒语音DAT(ii)FDB-1000(固定射线) | 细微差别 | 脚本演讲 | 荷兰的 | 比利时 | 低背景噪音 | 1,000 | 1 | 52000年 | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个说话人52个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词以及自动控制项 |
荷兰语(比利时)脚本电话 | |
19. | 音频 | ASR,虚拟助手,汽车HMI和娱乐 | 麦克风和手机 | 27小时 | 添加引用 | 荷兰语和佛兰德语的演讲车 | 细微差别 | 脚本演讲 | 荷兰的 | 荷兰-比利时 | 混合(车内) | 302. | 5. | 15100年 | 要求可以办到 | 16和8. | 一条法律 | 数据集是完全转录的,并伴随着发音词典和验证报告 每名成人演讲者会有125个提示,包括数字、自然数字、字母串、个人、地点和商业名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发讲话的提示 |
荷兰人(荷兰和比利时)脚本车内 | |
66. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 36个小时 | 添加引用 | NLD_ASR001 | Appen Global. | 会话演讲 | 荷兰的 | 荷兰 | 低背景噪音 | 200. | 2 | 要求可以办到 | 14,964 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
荷兰(荷兰)会话电话 | |
164 | 文本 | ASR, TTS,语言建模 | N / A. | 45,000个字 | 添加引用 | nld_nld_phon. | Appen Global. | 发音字典 | 荷兰的 | 荷兰 | N / A. | N / A. | N / A. | N / A. | 45000年 | N / A. | 文本 | 荷兰语(荷兰)的发音词典 | ||
92 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 68小时 | 添加引用 | 荷兰语,来自荷兰 | 细微差别 | 脚本演讲 | 荷兰的 | 荷兰 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
荷兰语(荷兰)脚本话筒 | |
122 | 图像 | 面部识别 | 相机 | 14948张图片 | 添加引用 | IMG_FACE_KEN_CN | Appen中国 | 人类的脸 | N / A. | 肯尼亚 | 混合背景和照明条件 | 99 | N / A. | N / A. | N / A. | N / A. | jpg. | 图片包含9种不同光线条件的所有组合,参与者面部和智能手机之间的2种不同距离,7种不同的摄像角度 每个人随机选取32张图片,包括太阳镜、面具、假发或帽子等遮挡物 随机拍摄的36张照片包含不同的面部表情,包括凝视、张嘴、撅嘴、微笑和皱眉 照明条件:室内正常灯,户外普通灯,室内背光,室外背光,室内普通深光,全黑屏填充光,点光源(白光,路灯),霓虹灯,侧眩光) 摄像头角度:前、左45°、右45°、左15°、右15°、上30°、下30° |
东非面部影像 | |
21. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 28小时 | 添加引用 | ENA_ASR001. | Appen Global. | 会话演讲 | 英语 | 埃及 | 低背景噪音 | 250 | 2 | 要求可以办到 | 5,619 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 平均通话时长:10-15分钟 |
英语(阿拉伯语 - Levant /埃及)会话电话 | |
166 | 文本 | ASR, TTS,语言建模 | N / A. | 157,000字 | 添加引用 | eng_AUS_PHON | Appen Global. | 发音字典 | 英语 | 澳大利亚 | N / A. | N / A. | N / A. | N / A. | 157,000. | N / A. | 文本 | 英语(澳洲)发音字典 | ||
2 | 音频 | ASR、虚拟助理 | 手机和固定电话 | 92小时 | 添加引用 | aus_asr001. | Appen Global. | 脚本演讲 | 英语 | 澳大利亚 | 低背景噪音(家庭/办公室) | 500 | 1 | 82500年 | 35,137 | 8. | 一条法律 | 完全转录为Speathdat类型约定 数据集附有包含所有转录词的发音词典 每个说话人162个提示(朗读语音),包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项(来自215个)、语音丰富的句子和单词 |
英语(澳大利亚)脚本电话 | |
3. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 118小时 | 添加引用 | aus_asr002. | Appen Global. | 脚本演讲 | 英语 | 澳大利亚 | 混合 | 1,000 | 1 | 75000年 | 18,952 | 8. | 一条法律 | 完全转录为Speathdat类型约定 数据集附有包含所有转录词的发音词典 每个说话人有75个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词 提示是“读”和“引起的”项目的混合,其中5个每脚本的提示是“自发的免费演讲” |
英语(澳大利亚)脚本电话 | |
168 | 文本 | ASR, TTS,语言建模 | N / A. | 3000个单词 | 添加引用 | eng_CAN_POS | Appen Global. | 词法词典 | 英语 | 加拿大 | N / A. | N / A. | N / A. | N / A. | 3,000 | N / A. | 文本 | 英语(加拿大)语音词典的一部分 | ||
167 | 文本 | ASR, TTS,语言建模 | N / A. | 50000个单词 | 添加引用 | eng_can_phon. | Appen Global. | 发音字典 | 英语 | 加拿大 | N / A. | N / A. | N / A. | N / A. | 50,000. | N / A. | 文本 | 英语(加拿大)发音字典 | ||
22. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 144小时 | 添加引用 | ENC_ASR001 | Appen Global. | 脚本演讲 | 英语 | 加拿大 | 混合 | 1,000 | 1 | 99,000 | 12,483 | 8. | 法律或wav | 完全转录到Sala II / SpeemDAT类型的惯例 数据集附有包含所有转录词的发音词典 每个发言者有99个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词 |
英语(加拿大)脚本电话 | |
170 | 文本 | ASR, TTS,语言建模 | N / A. | 18,000字 | 添加引用 | eng_HKG_PHON | Appen Global. | 发音字典 | 英语 | 香港 | N / A. | N / A. | N / A. | N / A. | 18000年 | N / A. | 文本 | 英语(香港)发音词典 | ||
271 | 音频 | ASR,会话AI,语音分析 | 手机 | 143小时 | 添加引用 | ENI_ASR003. | Appen Global. | 会话演讲 | 英语 | 印度 | 混合(家庭、汽车、公共场所、户外) | 272 | 1 | 要求可以办到 | 要求可以办到 | 16. | 波 | 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。 每位演讲者参与长达5-15分钟的12次对话。 目前没有发音词典,但可根据要求开发 |
英语(印度)会话智能手机 | |
25. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 67小时 | 添加引用 | ENI_ASR002. | Appen Global. | 会话演讲 | 英语 | 印度 | 低背景噪音 | 540 | 2 | 77565年 | 11646年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 本项目共记录了271次电话通话 |
英语(印度)会话电话 | |
172 | 文本 | ASR, TTS,语言建模 | N / A. | 13000个单词 | 添加引用 | eng_IND_POS | Appen Global. | 词法词典 | 英语 | 印度 | N / A. | N / A. | N / A. | N / A. | 13,000. | N / A. | 文本 | 英语(印度)辞典部分 | ||
171 | 文本 | ASR, TTS,语言建模 | N / A. | 60,000字 | 添加引用 | eng_IND_PHON | Appen Global. | 发音字典 | 英语 | 印度 | N / A. | N / A. | N / A. | N / A. | 60,000 | N / A. | 文本 | 英语(印度)发音词典 | ||
24. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 217小时 | 添加引用 | ENI_ASR001. | Appen Global. | 脚本演讲 | 英语 | 印度 | 混合 | 2,358 | 1 | 117,900. | 9190年 | 8. | 一条法律 | 完全转录到speech hdat类型约定。 数据集伴随着包含所有转录单词的发音词典[SAMPA] 每个说话人49个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词 |
英语(印度)脚本电话 | |
173 | 文本 | ASR, TTS,语言建模 | N / A. | 12000字 | 添加引用 | eng_IRL_PHON | Appen Global. | 发音字典 | 英语 | 爱尔兰 | N / A. | N / A. | N / A. | N / A. | 12,000 | N / A. | 文本 | 英语(爱尔兰)发音词典 | ||
174 | 文本 | ASR, TTS,语言建模 | N / A. | 50000个单词 | 添加引用 | eng_NZL_PHON | Appen Global. | 发音字典 | 英语 | NZ. | N / A. | N / A. | N / A. | N / A. | 50,000. | N / A. | 文本 | 英语(新西兰)发音词典 | ||
23. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 53小时 | 添加引用 | ENF_ASR001. | Appen Global. | 会话演讲 | 英语 | 菲律宾 | 低背景噪音 | 450. | 2 | 41,602 | 7272年 | 8. | 法律或wav | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 平均通话时长:10-15分钟 |
英语(菲律宾)会话电话 | |
169 | 文本 | ASR, TTS,语言建模 | N / A. | 5000个单词 | 添加引用 | eng_phl_phon. | Appen Global. | 发音字典 | 英语 | 菲律宾 | N / A. | N / A. | N / A. | N / A. | 5000 | N / A. | 文本 | 英语(菲律宾)发音词典 | ||
165 | 文本 | ASR, TTS,语言建模 | N / A. | 5000个单词 | 添加引用 | Eng_are_Phon. | Appen Global. | 发音字典 | 英语 | 阿拉伯联合酋长国(阿联酋) | N / A. | N / A. | N / A. | N / A. | 5000 | N / A. | 文本 | 英语(阿拉伯联合酋长国(阿联酋))发音词典 | ||
67. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 33个小时 | 添加引用 | 阿拉伯联合酋长国说的东方英语 | 细微差别 | 脚本演讲 | 英语 | 阿拉伯联合酋长国(阿联酋) | 低背景噪音 | 500 | 1 | 25500年 | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 51每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富句和单词和自发项目进行控制 |
英语(阿拉伯联合酋长国(阿联酋))脚本电话 | |
104 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 150小时 | 添加引用 | UKE_ASR001 | Appen Global. | 会话演讲 | 英语 | 英国 | 低背景噪音 | 1150年 | 2 | 298,562 | 24193年 | 8. | 波 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 |
英语(英国)电话会话 | |
255 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 50个小时 | 添加引用 | UKE_ASR001B | Appen Global. | 会话演讲 | 英语 | 英国 | 低背景噪音 | 1150年 | 2 | 要求可以办到 | 13192年 | 8. | 波 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 |
英语(英国)电话会话 | |
176 | 文本 | ASR, TTS,语言建模 | N / A. | 155000个单词 | 添加引用 | eng_GBR_POS | Appen Global. | 词法词典 | 英语 | 英国 | N / A. | N / A. | N / A. | N / A. | 155000年 | N / A. | 文本 | 英语(英国)词汇词典部分 | ||
175 | 文本 | ASR, TTS,语言建模 | N / A. | 195,000个单词 | 添加引用 | Eng_gbr_phon. | Appen Global. | 发音字典 | 英语 | 英国 | N / A. | N / A. | N / A. | N / A. | 195,000 | N / A. | 文本 | 英语(英国)发音词典 | ||
99 | 音频 | TTS. | 耳机麦克风 | 11个小时 | 添加引用 | TC-STAR女性基线声音劳拉 | 细微差别 | 脚本演讲 | 英语 | 英国 | 低背景噪音(演播室) | 1 | 1 | 要求可以办到 | 要求可以办到 | 96 | 要求可以办到 | 数据集包括手动正交转录,自动分割成音素,自动生成音调标记(其中手动检查一定百分比的语音段和音调标记) 数据集附有一个带有词缀、引理和标音的发音词典 |
英语(英国)脚本麦克风 - 单身女性 | |
One hundred. | 音频 | TTS. | 耳机麦克风 | 7个小时 | 添加引用 | TC-STAR男性基线声音Ian | 细微差别 | 脚本演讲 | 英语 | 英国 | 低背景噪音(演播室) | 1 | 1 | 要求可以办到 | 要求可以办到 | 96 | 要求可以办到 | 数据集包括手动正交转录,自动分割成音素,自动生成音调标记(其中手动检查一定百分比的语音段和音调标记) 数据集附有一个带有词缀、引理和标音的发音词典 |
英语(英国)脚本麦克风-单身男性 | |
272 | 音频 | ASR,会话AI,语音分析 | 手机 | 50个小时 | 添加引用 | USE_ASR004 | Appen Global. | 会话演讲 | 英语 | 美国 | 混合(家庭、汽车、公共场所、户外) | 要求可以办到 | 1 | 要求可以办到 | 要求可以办到 | 16. | 波 | 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。 每位演讲者参与长达5-15分钟的12次对话。 目前没有发音词典,但可根据要求开发 |
英语(美国 - 非洲裔美国人)会话智能手机 | |
266 | 文本 | 虚拟助手,Chatbot | N / A. | 952,677消息 | 添加引用 | ENG_SMS001 | Appen Global. | SMS文本消息 | 英语 | 美国 | N / A. | 要求可以办到 | N / A. | 952677年 | 要求可以办到 | N / A. | 文本 | 该数据集包含2个参与者之间的线程短信对话,使用iMessage和Android短信。所有的信息都是美式英语。包含时间戳和文本信息交换,元数据包括性别、年龄范围和参与者之间的关系。从所有参与者获得同意,数据集不包含PII。 | 英语(美国)对话短信 - 线程 | |
267 | 文本 | 虚拟助手,Chatbot | N / A. | 106649条信息 | 添加引用 | ENG_SMS001A | Appen Global. | SMS文本消息 | 英语 | 美国 | N / A. | 390. | N / A. | 106,649. | 要求可以办到 | N / A. | 文本 | 这是ENG_SMS001的子集。该数据集包含2个参与者之间的线程短信对话,使用iMessage和Android短信。所有的信息都是美式英语。包含时间戳和文本信息交换,元数据包括性别、年龄范围和参与者之间的关系。从所有参与者获得同意,数据集不包含PII。 | 英语(美国)对话短信 - 线程 | |
270 | 文本 | 虚拟助手,Chatbot | N / A. | 351,826消息 | 添加引用 | ENG_SMS002 | Appen Global. | WhatsApp短信 | 英语 | 美国 | N / A. | 要求可以办到 | N / A. | 351826年 | 要求可以办到 | N / A. | 文本 | 此数据集包含两个参与者之间使用WhatsApp的线程文本消息对话。所有信息都是美式英语。包含时间戳和文本消息交换,元数据包括性别、年龄范围和参与者之间的关系。获得所有参与者的同意,数据集不包含PII。 | 英语(美国)对话WhatsApp -线程 | |
107 | 音频 | ASR,会话AI,语音分析 | 手机 | 1000小时 | 添加引用 | USE_ASR003 | Appen Global. | 会话演讲 | 英语 | 美国 | 低背景噪音 | 2,000 | 1 | 500000年 | 52586年 | 16. | 波 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 对话的话题非常广泛,包括:学习/专业/工作、家乡、生活安排、天气和季节、准时、电视节目/电影) |
英语(美国)会话智能手机 | |
178 | 文本 | ASR, TTS,语言建模 | N / A. | 263000个单词 | 添加引用 | eng_USA_POS | Appen Global. | 词法词典 | 英语 | 美国 | N / A. | N / A. | N / A. | N / A. | 263,000. | N / A. | 文本 | 英语(美国)辞典部分 | ||
177 | 文本 | ASR, TTS,语言建模 | N / A. | 330000个单词 | 添加引用 | Eng_USA_PHON. | Appen Global. | 发音字典 | 英语 | 美国 | N / A. | N / A. | N / A. | N / A. | 33万 | N / A. | 文本 | 英语(美国)发音词典 | ||
93 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 53小时 | 添加引用 | speech English (USA)数据库 | 细微差别 | 脚本演讲 | 英语 | 美国 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
英语(美国)脚本麦克风 | |
106 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 62小时 | 添加引用 | USE_ASR001 | Appen Global. | 脚本演讲 | 英语 | 美国 | 低背景噪音(演播室) | 200. | 2 | 80000年 | 18,318 | 48. | 法律或wav | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 每个扬声器读取400个提示,包括数字,自然数,个人和城市名称,电话号码,通用命令和控制项目,语音富裕的句子和单词 |
英语(美国)脚本麦克风 | |
128 | 文本 | ner,内容分类,搜索引擎 | N / A. | 22,768句 | 添加引用 | Eng_ner001. | Appen Global. | 新闻网 | 英语 | N / A. | N / A. | N / A. | N / A. | 22768年 | 要求可以办到 | N / A. | 文本 | 英语NER新闻文本 | ||
132 | 文本 | ner,内容分类,搜索引擎 | N / A. | 19584句 | 添加引用 | FAR_NER001 | Appen Global. | 新闻网 | 伊朗波斯语 | 伊朗 | N / A. | N / A. | N / A. | 19,584 | 要求可以办到 | N / A. | 文本 | 波斯语/波斯语新闻文本 | ||
182 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | fin_fin_pos. | Appen Global. | 词法词典 | 芬兰 | 芬兰 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 芬兰语(芬兰)的言语字典的一部分 | ||
125 | 图像 | 文档处理,文档搜索 | 相机 | 7293张图片 | 添加引用 | IMG_OCR_FIN_CN. | Appen中国 | 文档OCR | 芬兰 | 芬兰 | 混合照明条件 | 4. | N / A. | N / A. | N / A. | N / A. | jpg. | 包含文字的图像,如广告牌/外包装/标牌/杂志/菜单等 | 芬兰文(芬兰)印刷文字OCR | |
181 | 文本 | ASR, TTS,语言建模 | N / A. | 85,000个字 | 添加引用 | fin_FIN_PHON | Appen Global. | 发音字典 | 芬兰 | 芬兰 | N / A. | N / A. | N / A. | N / A. | 85,000. | N / A. | 文本 | 芬兰语(芬兰)的发音词典 | ||
142 | 文本 | ASR, TTS,语言建模 | N / A. | 4000个单词 | 添加引用 | fra_DZA_PHON | Appen Global. | 发音字典 | 法国 | 阿尔及利亚 | N / A. | N / A. | N / A. | N / A. | 4000年 | N / A. | 文本 | 阿拉伯语字母 | 法语(阿尔及利亚)发音词典 | |
5. | 音频 | ASR、虚拟助理 | 仅固定电话 | 76小时 | 添加引用 | 比利时法语语音dat (II) FDB-1000 (FIXED1BF) | 细微差别 | 脚本演讲 | 法国 | 比利时 | 低背景噪音 | 1,000 | 1 | 53000年 | 要求可以办到 | 8. | 一条法律 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目,语音丰富的句子和单词和自发的控制项目 |
法语(比利时)脚本电话 | |
36. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 9小时 | 添加引用 | FRC_ASR003 | Appen Global. | 会话演讲 | 法国 | 加拿大 | 混合 | 68. | 2 | 要求可以办到 | 6022年 | 8. | 一条法律 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 平均通话时长:10-15分钟 对于大多数电话,只有一半的通话被收集和转录,然而,对于较少数量的电话,两个扬声器(内/外)都被收集和转录 |
法语(加拿大)会话电话 | |
183 | 文本 | ASR, TTS,语言建模 | N / A. | 67000个单词 | 添加引用 | fra_CAN_PHON | Appen Global. | 发音字典 | 法国 | 加拿大 | N / A. | N / A. | N / A. | N / A. | 67000年 | N / A. | 文本 | 法语(加拿大)的发音词典 | ||
35. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 46小时 | 添加引用 | FRC_ASR002 | Appen Global. | 脚本演讲 | 法国 | 加拿大 | 低背景噪音(家庭/办公室) | 150 | 1 | 22,500. | 10755年 | 16. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 150每个扬声器提示包括数字,数字字符串(随机生成),地址和语音富裕句子和单词 |
法语(加拿大)脚本麦克风 | |
34. | 音频 | ASR、虚拟助理 | 手机 | 131小时 | 添加引用 | FRC_ASR001 | Appen Global. | 脚本演讲 | 法国 | 加拿大 | 混合 | 1,000 | 1 | 100,000 | 11,697 | 8. | 一条法律 | 完全转录为Speathdat类型约定 数据集伴随着包含所有转录单词的发音词典[SAMPA] 每个发言者100个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词 |
法语(加拿大)脚本电话 | |
275 | 音频 | ASR,会话AI,语音分析 | 手机 | 159小时 | 添加引用 | FRF_ASR004 | Appen Global. | 会话演讲 | 法国 | 法国 | 混合(家庭、汽车、公共场所、户外) | 298 | 1 | 要求可以办到 | 要求可以办到 | 16. | 波 | 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。 每位演讲者参与长达5-15分钟的12次对话。 目前没有发音词典,但可根据要求开发 |
法语(法国)会话智能手机 | |
40 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 25小时 | 添加引用 | FRF_ASR001 | Appen Global. | 会话演讲 | 法国 | 法国 | 低背景噪音 | 563 | 2 | 要求可以办到 | 11922年 | 8. | 一条法律 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录 |
法国(法国)会话电话 | |
39. | 音频 | ASR,虚拟助手,汽车HMI和娱乐 | 麦克风和手机 | 113小时 | 添加引用 | 法国演说 - 汽车 | 细微差别 | 脚本演讲 | 法国 | 法国 | 混合(车内) | 300 | 5. | 37,500 | 要求可以办到 | 16和8. | 要求可以办到 | 数据集是完全转录的,并伴随着发音词典和验证报告 每个演讲者大约有125个提示,包括数字、自然数字、字母串、个人、地点和企业名称(有些是自发的)、通用的命令和控制项、语音丰富的单词和句子以及自发讲话的提示 113.7小时 |
法国(法国)车内 | |
185 | 文本 | ASR, TTS,语言建模 | N / A. | 95,000字 | 添加引用 | fra\ U fra\ U位置 | Appen Global. | 词法词典 | 法国 | 法国 | N / A. | N / A. | N / A. | N / A. | 95000年 | N / A. | 文本 | 《法语词汇词典》 | ||
184 | 文本 | ASR, TTS,语言建模 | N / A. | 112,000字 | 添加引用 | fra_fra_phon. | Appen Global. | 发音字典 | 法国 | 法国 | N / A. | N / A. | N / A. | N / A. | 112,000 | N / A. | 文本 | 法语发音词典 | ||
41. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 26小时 | 添加引用 | FRF_ASR003 | 全球手机 | 脚本演讲 | 法国 | 法国 | 低背景噪音(家庭/办公室) | 98 | 1 | 10273年 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
法语(法国)脚本麦克风 | |
37. | 音频 | ASR、虚拟助理 | 仅固定电话 | 41小时 | 添加引用 | 法国SpeechDat (II)身上- 1000 | 细微差别 | 脚本演讲 | 法国 | 法国 | 低背景噪音(家庭/办公室) | 1,017 | 1 | 48000年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词 |
法国(法国)脚本电话 | |
38. | 音频 | ASR、虚拟助理 | 仅固定电话 | 305小时 | 添加引用 | 法语SpeemDAT(ii)FDB-5000 | 细微差别 | 脚本演讲 | 法国 | 法国 | 低背景噪音 | 5,040 | 1 | 237,000 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 47每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词 |
法国(法国)脚本电话 | |
60. | 音频 | ASR、虚拟助理 | 仅固定电话 | 45个小时 | 添加引用 | 卢森堡法国语音(ii)FDB-500(固定地1LF) | 细微差别 | 脚本演讲 | 法国 | 卢森堡 | 低背景噪音 | 614. | 1 | 32,000 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词 |
法语(卢森堡)电话 | |
273 | 音频 | ASR,会话AI,语音分析 | 手机 | 104小时 | 添加引用 | deu_asr004. | Appen Global. | 会话演讲 | 德国的 | 德国 | 混合(家庭、汽车、公共场所、户外) | 198 | 1 | 要求可以办到 | 要求可以办到 | 16. | 波 | 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。 每位演讲者参与长达5-15分钟的12次对话。 目前没有发音词典,但可根据要求开发 |
德国(德国)会话智能手机 | |
186 | 文本 | ASR, TTS,语言建模 | N / A. | 146,000个单词 | 添加引用 | deu_deu_phon. | Appen Global. | 发音字典 | 德国的 | 德国 | N / A. | N / A. | N / A. | N / A. | 146000年 | N / A. | 文本 | 德语发音词典 | ||
16. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 16个小时 | 添加引用 | deu_asr001. | Appen Global. | 脚本演讲 | 德国的 | 德国 | 低背景噪音(演播室) | 127 | 2 | 12700年 | 6826年 | 16. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 每位演讲者朗读100个提示,包括数字、自然数字、人名和城市名、电话号码、通用命令和控制项、语音丰富的句子和单词 |
德国(德国)脚本麦克风 | |
18. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 25小时 | 添加引用 | deu_asr003. | 全球手机 | 脚本演讲 | 德国的 | 德国 | 低背景噪音(家庭/办公室) | 77 | 1 | 10085年 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
德国(德国)脚本麦克风 | |
42. | 音频 | ASR、虚拟助理 | 仅固定电话 | 31个小时 | 添加引用 | 德语演讲稿FDB-1000 | 细微差别 | 脚本演讲 | 德国的 | 德国 | 低背景噪音(家庭/办公室) | 988 | 1 | 43000年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词 |
德国(德国)电话 | |
43. | 音频 | ASR、虚拟助理 | 仅固定电话 | 268小时 | 添加引用 | 德国语音DAT(ii)FDB-4000 | 细微差别 | 脚本演讲 | 德国的 | 德国 | 低背景噪音(家庭/办公室) | 4000年 | 1 | 160,000 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 40每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词 |
德国(德国)电话 | |
61. | 音频 | ASR、虚拟助理 | 仅固定电话 | 33个小时 | 添加引用 | 卢森堡德语语音dat (II) FDB-500 (FIXED1LG) | 细微差别 | 脚本演讲 | 德国的 | 卢森堡 | 低背景噪音 | 500 | 1 | 26,500. | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词 |
德国(卢森堡)电话 | |
187 | 文本 | ASR, TTS,语言建模 | N / A. | 15000个单词 | 添加引用 | deu_CHE_PHON | Appen Global. | 发音字典 | 德国的 | 瑞士 | N / A. | N / A. | N / A. | N / A. | 15000年 | N / A. | 文本 | 德语(瑞士)发音词典 | ||
94 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 53小时 | 添加引用 | SPEECON德国人(瑞士)数据库 | 细微差别 | 脚本演讲 | 德国的 | 瑞士 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
德语(瑞士)脚本麦克风 | |
68. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 31个小时 | 添加引用 | 土耳其语讲德语 | 细微差别 | 脚本演讲 | 德国的 | 火鸡 | 低背景噪音 | 300 | 1 | 15600年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者有52个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词 |
德语(土耳其)电话 | |
188 | 文本 | ASR, TTS,语言建模 | N / A. | 5000个单词 | 添加引用 | ell_grc_phon. | Appen Global. | 发音字典 | 希腊语 | 希腊 | N / A. | N / A. | N / A. | N / A. | 5000 | N / A. | 文本 | 希腊(希腊)的发音词典 | ||
117 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 191小时 | 添加引用 | GRE_ASR001_CN | Appen中国 | 脚本演讲 | 希腊语 | 希腊 | 低背景噪音(家庭/办公室) | 287 | 1 | 54,113 | 68271年 | 16. | 波 | 数据集包含带有相应文本提示的音频 | 希腊脚本智能手机 | |
189 | 文本 | ASR, TTS,语言建模 | N / A. | 35000字 | 添加引用 | grn_PRY_PHON | Appen Global. | 发音字典 | 瓜拉尼 | 巴拉圭 | N / A. | N / A. | N / A. | N / A. | 35,000. | N / A. | 文本 | 瓜拉尼语(巴拉圭)发音词典 | ||
190 | 文本 | ASR, TTS,语言建模 | N / A. | 15000个单词 | 添加引用 | hat_HTI_PHON | Appen Global. | 发音字典 | 海地克里奥尔 | 海地 | N / A. | N / A. | N / A. | N / A. | 15000年 | N / A. | 文本 | 海地克里奥尔(海地)发音词典 | ||
45. | 音频 | ASR,会话AI,语音分析 | 手机 | 33个小时 | 添加引用 | 上海ASR002 | Appen Global. | 会话演讲 | 豪萨语 | 尼日利亚 | 低背景噪音 | 200. | 2 | 要求可以办到 | 7,949 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
Hausa(尼日利亚)会话电话 | |
191 | 文本 | ASR, TTS,语言建模 | N / A. | 11,000字 | 添加引用 | hau_NGA_PHON | Appen Global. | 发音字典 | 豪萨语 | 尼日利亚 | N / A. | N / A. | N / A. | N / A. | 11,000 | N / A. | 文本 | 豪萨语(尼日利亚)发音词典 | ||
44. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 20小时 | 添加引用 | 上海ASR001 | 全球手机 | 脚本演讲 | 豪萨语 | 喀麦隆 | 低背景噪音(家庭/办公室) | 103 | 1 | 7,895 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
豪萨语的麦克风 | |
46. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 34小时 | 添加引用 | HEB_ASR001 | Appen Global. | 会话演讲 | 希伯来语 | 以色列 | 低背景噪音 | 200. | 2 | 要求可以办到 | 19250年 | 8. | 法律或wav | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
希伯来语(以色列)会话电话 | |
192 | 文本 | ASR, TTS,语言建模 | N / A. | 31,000字 | 添加引用 | heb_ISR_PHON | Appen Global. | 发音字典 | 希伯来语 | 以色列 | N / A. | N / A. | N / A. | N / A. | 31000年 | N / A. | 文本 | 希伯来语(以色列)发音词典 | ||
48. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 32小时 | 添加引用 | HIN_ASR002 | Appen Global. | 会话演讲 | 北印度语 | 印度 | 混合 | 996 | 2 | 要求可以办到 | 12,266 | 8. | 波 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录 |
印地语(印度)会话电话 | |
193 | 文本 | ASR, TTS,语言建模 | 35000字 | 添加引用 | hin_ind_phon. | Appen Global. | 发音字典 | 北印度语 | 印度 | N / A. | N / A. | N / A. | N / A. | 35,000. | N / A. | 文本 | 印地语(印度)的发音词典 | |||
47. | 音频 | ASR、虚拟助理 | 手机 | 224小时 | 添加引用 | HIN_ASR001 | Appen Global. | 脚本演讲 | 北印度语 | 印度 | 低背景噪音 | 1,920 | 1 | 96,000 | 9853年 | 8. | 一条法律 | 完全转录为Speathdat类型约定 数据集伴随着包含所有转录单词的发音词典[SAMPA] 50个扬声器提示,包括数字,自然数,个人,业务和名称,网址,确认项目(是,否+模糊),通用命令和控制项目,语音富裕的句子和单词 |
印地语(印度)脚本电话 | |
126 | 视频 | 健身应用,行动分类,手势识别 | 手机 | 2000个视频 | 添加引用 | ved_human_body_cn. | Appen中国 | 人体 | N / A. | 中国 | 混合背景和照明条件 | 1000 | N / A. | N / A. | N / A. | N / A. | mp4 | 视频剪辑长约10-20秒 | 人体运动 | |
194 | 文本 | ASR, TTS,语言建模 | N / A. | 500字 | 添加引用 | hun_hun_phon. | Appen Global. | 发音字典 | 匈牙利 | 匈牙利 | N / A. | N / A. | N / A. | N / A. | 500 | N / A. | 文本 | 匈牙利语发音词典 | ||
118 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 286小时 | 添加引用 | hun_asr001_cn. | Appen中国 | 脚本演讲 | 匈牙利 | 匈牙利 | 低背景噪音(家庭/办公室) | 254 | 1 | 94031年 | 201921年 | 16. | 波 | 数据集包含带有相应文本提示的音频 | 匈牙利语(匈牙利)脚本智能手机 | |
49. | 音频 | ASR、虚拟助理 | 仅固定电话 | 65小时 | 添加引用 | 匈牙利语演说(e) | 细微差别 | 脚本演讲 | 匈牙利 | 匈牙利 | 低背景噪音 | 1,000 | 1 | 48000年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词 |
匈牙利(匈牙利)脚本电话 | |
195 | 文本 | ASR, TTS,语言建模 | N / A. | 30000个单词 | 添加引用 | ibo_nga_phon. | Appen Global. | 发音字典 | 伊博 | 尼日利亚 | N / A. | N / A. | N / A. | N / A. | 30000年 | N / A. | 文本 | Igbo(尼日利亚)的发音词典 | ||
149 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | ind_idn_pos. | Appen Global. | 词法词典 | 印度尼西亚 | 印尼 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 印度尼西亚语(印度尼西亚)的言语字典的一部分 | ||
148 | 文本 | ASR, TTS,语言建模 | N / A. | 95,000字 | 添加引用 | ind_IDN_PHON | Appen Global. | 发音字典 | 印度尼西亚 | 印尼 | N / A. | N / A. | N / A. | N / A. | 95000年 | N / A. | 文本 | 印度尼西亚(印度尼西亚)的发音词典 | ||
262 | 音频 | ASR,会话AI,语音分析 | 手机 | 100小时 | 添加引用 | NMG\ U ASR001\中国 | Appen中国 | 会话演讲 | 内蒙古 | 中国 | 低背景噪音 | 200. | 1 | 16. | 波 | 音频;不包括转录 录音内容包括:锡林郭勒盟、通辽、呼和浩特。每个录音环节包含2个人之间约30分钟的自由对话。 |
内蒙古(中国)话 | |||
32. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 30小时 | 添加引用 | far_asr002. | Appen Global. | 会话演讲 | 伊朗波斯(波斯岛) | 伊朗 | 混合 | 1,000 | 2 | 要求可以办到 | 12358年 | 8. | 波 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 |
伊朗波斯(波斯语)(伊朗)会话电话 | |
31. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 85小时 | 添加引用 | far_asr001. | Appen Global. | 脚本演讲 | 伊朗波斯(波斯岛) | 伊朗 | 混合 | 789. | 1 | 38,400 | 8,716 | 8. | 一条法律 | 完全被转录为Orientel类型约定 数据集伴随着包含所有转录单词的发音词典[SAMPA] 每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词 |
伊朗波斯语(波斯语)(伊朗)脚本电话 | |
180 | 文本 | ASR, TTS,语言建模 | N / A. | 1,400,000字 | 添加引用 | pes_IRN_POS | Appen Global. | 词法词典 | 伊朗波斯语 | 伊朗 | N / A. | N / A. | N / A. | N / A. | 1,400,000. | N / A. | 文本 | 伊朗波斯语(伊朗)辞典部分 | ||
179 | 文本 | ASR, TTS,语言建模 | N / A. | 80000个单词 | 添加引用 | 电话号码 | Appen Global. | 发音字典 | 伊朗波斯语 | 伊朗 | N / A. | N / A. | N / A. | N / A. | 80000年 | N / A. | 文本 | 伊朗语发音词典 | ||
276 | 音频 | ASR,会话AI,语音分析 | 手机 | 256小时 | 添加引用 | ITA_ASR005. | Appen Global. | 会话演讲 | 意大利 | 意大利 | 混合(家庭、汽车、公共场所、户外) | 482. | 1 | 要求可以办到 | 要求可以办到 | 16. | 波 | 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。 每位演讲者参与长达5-15分钟的12次对话。 目前没有发音词典,但可根据要求开发 |
意大利语(意大利)会话智能手机 | |
52. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 36个小时 | 添加引用 | ITA_ASR003. | Appen Global. | 会话演讲 | 意大利 | 意大利 | 低背景噪音 | 200. | 2 | 要求可以办到 | 18,974 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
意大利语(意大利)会话电话 | |
197 | 文本 | ASR, TTS,语言建模 | N / A. | 147000个单词 | 添加引用 | ITA_ITA_POS. | Appen Global. | 词法词典 | 意大利 | 意大利 | N / A. | N / A. | N / A. | N / A. | 147000年 | N / A. | 文本 | 意大利语(意大利)词典词典 | ||
196 | 文本 | ASR, TTS,语言建模 | N / A. | 197,000个单词 | 添加引用 | 伊塔丰 | Appen Global. | 发音字典 | 意大利 | 意大利 | N / A. | N / A. | N / A. | N / A. | 197,000 | N / A. | 文本 | 意大利语(意大利)发音字典 | ||
50. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 44小时 | 添加引用 | ITA_ASR001. | Appen Global. | 脚本演讲 | 意大利 | 意大利 | 混合 | 200. | 4. | 40,000 | 7,316 | 22. | 一条法律 | 完全转录为Speathdat类型约定 数据集附有包含所有转录词的发音词典 每位发言者200提示,包括100个命令和控制类型项目和100个语音富裕的句子 |
意大利(意大利)脚本麦克风 | |
53. | 音频 | TTS. | 麦克风 | 3小时 | 添加引用 | ITA_TTS001. | Appen Global. | 脚本演讲 | 意大利 | 意大利 | 低背景噪音(演播室) | 1 | 1 | 3,300 | 要求可以办到 | 22. | 一条法律 | DataSet伴随着包含数据集中的所有单词的发音词典 3,300个扬声器提示,包括语音富裕的句子 |
意大利(意大利)脚本麦克风 | |
51. | 音频 | ASR,虚拟助手,汽车HMI和娱乐 | 麦克风 | 47小时 | 添加引用 | ITA_ASR002. | Appen Global. | 脚本演讲 | 意大利 | 意大利 | 混合(车内) | 205. | 4. | 35875年 | 10366年 | 48. | 一条法律 | 完全转录为Speathdat类型约定 数据集附有包含所有转录词的发音词典 每个说话人350个提示,包括数字、街道名称、通用命令和控制项、语音丰富的句子和单词 每个扬声器记录1OR 2次会话,包括在停放的车辆中的会话1,其中发动机运行和在60英里/小时的车辆中的课程2(100 km / h) |
意大利语(意大利)脚本麦克风in-car | |
54. | 音频 | ASR、虚拟助理 | 仅固定电话 | 38小时 | 添加引用 | 意大利固定网络语音语音语音(M)语料库 | 细微差别 | 脚本演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 1,000 | 1 | 39000年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每名发言者提供39个提示,包括孤立和连接的数字、自然数字、金钱数量、拼写单词、时间和日期短语、是/否问题、城市名称、常见应用词、短语中的应用词和语音丰富的句子 |
意大利(意大利)电话 | |
55. | 音频 | ASR、虚拟助理 | 仅固定电话 | 228小时 | 添加引用 | 意大利语演说(ii)FDB-3000 | 细微差别 | 脚本演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 3,040 | 1 | 134,000 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词 |
意大利(意大利)电话 | |
56. | 音频 | ASR、虚拟助理 | 手机 | 103小时 | 添加引用 | 意大利语音(II)MDB-250 | 细微差别 | 脚本演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 375. | 1 | 19,000. | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 51个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词 |
意大利(意大利)电话 | |
89 | 音频 | ASR、虚拟助理 | 手机 | 13个小时 | 添加引用 | SpeemDAT(M)意大利移动网络语音数据库 | 细微差别 | 脚本演讲 | 意大利 | 意大利 | 低背景噪音(家庭/办公室) | 342. | 1 | 13500年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 40每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词 |
意大利(意大利)电话 | |
199 | 文本 | ASR, TTS,语言建模 | N / A. | 265,000字 | 添加引用 | jpn_jpn_pos. | Appen Global. | 词法词典 | 日本 | 日本 | N / A. | N / A. | N / A. | N / A. | 265000年 | N / A. | 文本 | 日语(日语)部分词汇词典 | ||
198 | 文本 | ASR, TTS,语言建模 | N / A. | 262000个单词 | 添加引用 | jpn_JPN_PHON | Appen Global. | 发音字典 | 日本 | 日本 | N / A. | N / A. | N / A. | N / A. | 262,000. | N / A. | 文本 | 日本(日本)发音词典 | ||
57. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 33个小时 | 添加引用 | JPN_ASR001 | 全球手机 | 脚本演讲 | 日本 | 日本 | 低背景噪音(家庭/办公室) | 144 | 1 | 13067年 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
日本(日本)脚本麦克风 | |
95 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 57小时 | 添加引用 | Speecon日语 | 细微差别 | 脚本演讲 | 日本 | 日本 | 混合(办公室,娱乐,汽车,公共场所) | 600人(550名成人和50名儿童) | 4. | 170000年 | 要求可以办到 | 16. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应 |
日本(日本)脚本麦克风 | |
133 | 文本 | ner,内容分类,搜索引擎 | N / A. | 20,629句 | 添加引用 | JPY_NER001. | Appen Global. | 新闻网 | 日本 | 日本 | N / A. | N / A. | N / A. | 20,629 | 要求可以办到 | N / A. | 文本 | 日语NER新闻文本 | ||
200. | 文本 | ASR, TTS,语言建模 | N / A. | 20,000个字 | 添加引用 | jav_IDN_PHON | Appen Global. | 发音字典 | 爪哇 | 印尼 | N / A. | N / A. | N / A. | N / A. | 20,000 | N / A. | 文本 | 爪哇(印度尼西亚)发音字典 | ||
58. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 15个小时 | 添加引用 | KAN\ U ASR001型 | Appen Global. | 会话演讲 | 埃纳德语 | 印度 | 混合 | 178 | 2 | 要求可以办到 | 15660年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 |
Kannada(印度)会话电话 | |
109 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 57小时 | 添加引用 | KAN_ASR001A | Appen Global. | 会话演讲 | 埃纳德语 | 印度 | 混合 | 1,000 | 2 | 要求可以办到 | 15660年 | 8. | 一条法律 | 约。25%的数据集会话是转录和时间戳 - 可以提供完整的成绩单 数据库附带一个包含所有转录单词的发音词典 |
Kannada(印度)会话电话 | |
201. | 文本 | ASR, TTS,语言建模 | N / A. | 49,000字 | 添加引用 | kan_IND_PHON | Appen Global. | 发音字典 | 埃纳德语 | 印度 | N / A. | N / A. | N / A. | N / A. | 49000年 | N / A. | 文本 | 卡纳达语(印度)发音词典 | ||
202. | 文本 | ASR, TTS,语言建模 | N / A. | 30000个单词 | 添加引用 | Kaz_kaz_phon. | Appen Global. | 发音字典 | 哈萨克 | 哈萨克斯坦 | N / A. | N / A. | N / A. | N / A. | 30000年 | N / A. | 文本 | 哈萨克语(哈萨克斯坦)发音词典 | ||
204. | 文本 | ASR, TTS,语言建模 | N / A. | 10万字 | 添加引用 | kor\u kor\u位置 | Appen Global. | 词法词典 | 朝鲜文 | 韩国 | N / A. | N / A. | N / A. | N / A. | 100,000 | N / A. | 文本 | 韩语部分语音词典 | ||
203. | 文本 | ASR, TTS,语言建模 | N / A. | 10万字 | 添加引用 | Kor_kor_phon. | Appen Global. | 发音字典 | 朝鲜文 | 韩国 | N / A. | N / A. | N / A. | N / A. | 100,000 | N / A. | 文本 | 韩国(韩国)的发音词典 | ||
59. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 20小时 | 添加引用 | Kor_Asr001. | 全球手机 | 脚本演讲 | 朝鲜文 | 韩国 | 低背景噪音(家庭/办公室) | One hundred. | 1 | 8,107 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
韩语(韩国)脚本话筒 | |
129 | 文本 | ner,内容分类,搜索引擎 | N / A. | 25,830句 | 添加引用 | Kor_ner001. | Appen Global. | 新闻网 | 朝鲜文 | 韩国 | N / A. | N / A. | N / A. | 25,830 | 要求可以办到 | N / A. | 文本 | 韩语NER新闻文本 | ||
205. | 文本 | ASR, TTS,语言建模 | N / A. | 60,000字 | 添加引用 | kur_tur_phon. | Appen Global. | 发音字典 | Kurmanji. | 火鸡 | N / A. | N / A. | N / A. | N / A. | 60,000 | N / A. | 文本 | 土耳其语发音词典 | ||
206 | 文本 | ASR, TTS,语言建模 | N / A. | 9,000字 | 添加引用 | 老泳老泳丰 | Appen Global. | 发音字典 | 老挝 | 老挝 | N / A. | N / A. | N / A. | N / A. | 9000年 | N / A. | 文本 | 老挝语发音词典 | ||
207 | 文本 | ASR, TTS,语言建模 | N / A. | 71000个单词 | 添加引用 | lit_LTU_PHON | Appen Global. | 发音字典 | 立陶宛语 | 立陶宛 | N / A. | N / A. | N / A. | N / A. | 71000年 | N / A. | 文本 | 立陶宛语(立陶宛)的发音词典 | ||
208 | 文本 | ASR, TTS,语言建模 | N / A. | 19,000字 | 添加引用 | mal_IND_PHON | Appen Global. | 发音字典 | 马拉雅拉姆语 | 印度 | N / A. | N / A. | N / A. | N / A. | 19,000. | N / A. | 文本 | 《马来语(印度)发音词典》 | ||
209 | 文本 | ASR, TTS,语言建模 | N / A. | 10,000字 | 添加引用 | msa_MYS_PHON | Appen Global. | 发音字典 | 马来西亚 | 马来西亚 | N / A. | N / A. | N / A. | N / A. | 10,000 | N / A. | 文本 | 马来西亚发音词典 | ||
210 | 文本 | ASR, TTS,语言建模 | N / A. | 35000字 | 添加引用 | zho_chn_phon. | Appen Global. | 发音字典 | 中文(简体) | 中国 | N / A. | N / A. | N / A. | N / A. | 35,000. | N / A. | 文本 | 普通话(简体)(中国)发音词典 | ||
211 | 文本 | ASR, TTS,语言建模 | N / A. | 50000个单词 | 添加引用 | zho_twn_phon. | Appen Global. | 发音字典 | 中文(繁体) | 台湾 | N / A. | N / A. | N / A. | N / A. | 50,000. | N / A. | 文本 | 普通话(传统)(台湾)发音词典 | ||
63. | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 26小时 | 添加引用 | MAC_ASR002 | 全球手机 | 脚本演讲 | 普通话中文 | 中国 | 低背景噪音(家庭/办公室) | 132 | 1 | 10,225 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
普通话(中国)脚本麦克风 | |
62. | 音频 | ASR、虚拟助理 | 手机和固定电话 | 323小时 | 添加引用 | MAC_ASR001 | Appen Global. | 脚本演讲 | 普通话中文 | 中国 | 混合 | 2,000 | 1 | 200000 | 7145年 | 8. | 一条法律 | 完全转录为Speathdat类型约定 数据集伴随着包含所有转录单词的发音词典[SAMPA] 98提示每位发言者包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目(从一组215),语音富裕的句子和单词 |
普通话中文(中国)脚本电话 | |
131 | 文本 | ner,内容分类,搜索引擎 | N / A. | 17,313句 | 添加引用 | MAC\ U NER001型 | Appen Global. | 新闻网 | 普通话中文 | 中国 | N / A. | N / A. | N / A. | 17313年 | 要求可以办到 | N / A. | 文本 | 中文新闻文本 | ||
64. | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 15个小时 | 添加引用 | mar_asr001. | Appen Global. | 会话演讲 | 马拉地语 | 印度 | 混合 | 180 | 2 | 要求可以办到 | 11908年 | 8. | 一条法律 | 大约29%的数据集会话被转录并打上了时间戳——完整的转录本可以被使用 数据集附有包含所有转录词的发音词典 |
马拉地语(印度)对话电话 | |
110 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 52小时 | 添加引用 | mar_asr001a. | Appen Global. | 会话演讲 | 马拉地语 | 印度 | 混合 | 1,000 | 2 | 要求可以办到 | 11908年 | 8. | 一条法律 | 部分数据集会话被转录并打上时间戳——完整的转录本可以提供 数据集附有包含所有转录词的发音词典 |
马拉地语(印度)对话电话 | |
212 | 文本 | ASR, TTS,语言建模 | N / A. | 30000个单词 | 添加引用 | 马鲁因德丰 | Appen Global. | 发音字典 | 马拉地语 | 印度 | N / A. | N / A. | N / A. | N / A. | 30000年 | N / A. | 文本 | 马拉地语(印度)发音词典 | ||
213 | 文本 | ASR, TTS,语言建模 | N / A. | 30000个单词 | 添加引用 | mon_mng_phon. | Appen Global. | 发音字典 | 蒙 | 蒙古 | N / A. | N / A. | N / A. | N / A. | 30000年 | N / A. | 文本 | 蒙古(蒙古)的发音词典 | ||
215 | 文本 | ASR, TTS,语言建模 | N / A. | 3000个单词 | 添加引用 | nor_NOR_POS | Appen Global. | 词法词典 | 挪威 | 挪威 | N / A. | N / A. | N / A. | N / A. | 3,000 | N / A. | 文本 | 挪威(挪威)词典的一部分 | ||
214 | 文本 | ASR, TTS,语言建模 | N / A. | 115000个单词 | 添加引用 | 诺乌诺乌丰 | Appen Global. | 发音字典 | 挪威 | 挪威 | N / A. | N / A. | N / A. | N / A. | 115,000. | N / A. | 文本 | 挪威(挪威)发音词典 | ||
264 | 图像 | 图像标签识别培训 | 手机和相机 | 2196张图片 | 添加引用 | img_tag_cn. | Appen中国 | 对象的形象 | N / A. | N / A. | 混合照明条件 | N / A. | N / A. | N / A. | jpg. | 多场景图片样本库共2196张图片,分类如下:KTV:50,百货公司:55,办公室:100;博物馆:63个;电器:55台;海军:191人;汽车:50辆;手提包:35个;夜景:54;运动器材:54件;便利店:34家;餐厅:54家;窗景:62;宠物:82只;船舶:50艘;动物园,70岁;服装店:53家;海滩:95;机场:65张机票;健身房:47;景点:77个;人群:67人;沙漠:73;海滩:68;山区:54;购物中心:55家;树木:85;天空:102;雪:71;雪山:53;夜景:78;操场:94 | 对象图像集合 | |||
216 | 文本 | ASR, TTS,语言建模 | N / A. | 15000个单词 | 添加引用 | ori_ind_phon. | Appen Global. | 发音字典 | oriya. | 印度 | N / A. | N / A. | N / A. | N / A. | 15000年 | N / A. | 文本 | oriya(印度)的发音词典 | ||
80 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 20小时 | 添加引用 | PAP_ASR001 | Appen Global. | 会话演讲 | Panjabi. | 巴基斯坦 | 低背景噪音 | 205. | 2 | 要求可以办到 | 7298年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 71%的呼叫,两个扬声器(在线/单线)都收集并转录,但是,对于29%的电话,只收集了一半的谈话,并转录 |
旁遮普(巴基斯坦)对话电话 | |
74 | 音频 | ASR,自动标题,关键字斑点 | 麦克风 | 51小时 | 添加引用 | PAS_BRC001. | Appen Global. | 广播演讲 | 北普什 - 南普什岛 | 阿富汗 | 低背景噪音(演播室) | N / A. | 1 | 要求可以办到 | 要求可以办到 | N / A. | 波 | 数据集已完全转录和时间戳 目前没有发音词典,但可根据要求开发 数据集主要是语音,不包括音乐和广告 数据类型包括:谈话节目,访谈,新闻广播(不包括锚的新闻读数) |
Pashto(阿富汗)播出 | |
73 | 音频 | ASR,会话AI,语音分析 | 麦克风 | 39小时 | 添加引用 | PAS_ASR002 | Appen Global. | 会话演讲 | 北普什 - 南普什岛 | 阿富汗 | 低背景噪音 | 40 | 2 | 34860 | 9480年 | 16. | 波 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 此外,你还可以购买成绩单的法文译本 平均呼叫长度:120分钟,一个发言者作为面试官,另一个人作为访受方案的另一个人类似于Transtac风格(例如民事,检查站等) 面试官出现在多种对话中,但受访者对每套都是独一无二的 |
普什图语(阿富汗)会话话筒 | |
72 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 55个小时 | 添加引用 | PAS_ASR001 | Appen Global. | 会话演讲 | 北普什 - 南普什岛 | 阿富汗 | 低背景噪音 | 967 | 2 | 要求可以办到 | 13,633 | 8. | 波 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录 |
Pashto(阿富汗)会话电话 | |
217 | 文本 | ASR, TTS,语言建模 | N / A. | 65000个单词 | 添加引用 | pus_afg_phon. | Appen Global. | 发音字典 | 粉碎 | 阿富汗 | N / A. | N / A. | N / A. | N / A. | 65000年 | N / A. | 文本 | 帕什托(阿富汗)发音词典 | ||
219 | 文本 | ASR, TTS,语言建模 | N / A. | 4000个单词 | 添加引用 | pol_pol_pos. | Appen Global. | 词法词典 | 波兰的 | 波兰 | N / A. | N / A. | N / A. | N / A. | 4000年 | N / A. | 文本 | 波兰语(波兰)词语字典的一部分 | ||
218 | 文本 | ASR, TTS,语言建模 | N / A. | 40,000字 | 添加引用 | pol_POL_PHON | Appen Global. | 发音字典 | 波兰的 | 波兰 | N / A. | N / A. | N / A. | N / A. | 40,000 | N / A. | 文本 | 波兰语(波兰)的发音词典 | ||
75 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 25小时 | 添加引用 | pol_asr001. | 全球手机 | 脚本演讲 | 波兰的 | 波兰 | 低背景噪音(家庭/办公室) | 99 | 1 | 10,130. | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
波兰语(波兰)脚本麦克风 | |
119 | 音频 | ASR,虚拟助手,Chatbot | 手机 | 293小时 | 添加引用 | POL_ASR002_CN | Appen中国 | 脚本演讲 | 波兰的 | 波兰 | 低背景噪音(家庭/办公室) | 353. | 1 | 106,674 | 168,544 | 16. | 波 | 数据集包含带有相应文本提示的音频 | 波兰语(波兰)脚本智能手机 | |
76 | 音频 | ASR、虚拟助理 | 仅固定电话 | 78小时 | 添加引用 | 波兰语音DAT(e)数据库 | 细微差别 | 脚本演讲 | 波兰的 | 波兰 | 低背景噪音 | 1,000 | 1 | 48000年 | 要求可以办到 | 8. | 要求可以办到 | 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告 每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词 |
波兰语(波兰)脚本电话 | |
78 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 33个小时 | 添加引用 | PTB\单元ASR002 | Appen Global. | 会话演讲 | 葡萄牙语 | 巴西 | 低背景噪音 | 200. | 2 | 要求可以办到 | 11,287 | 8. | 一条法律 | 数据集是完全转录和时间戳 数据集附有包含所有转录词的发音词典 63%是固定电话,38%是手机 |
葡萄牙语(巴西)会话电话 | |
77 | 音频 | ASR,虚拟助手,Chatbot | 麦克风 | 26小时 | 添加引用 | PTB\单元ASR001 | 全球手机 | 脚本演讲 | 葡萄牙语 | 巴西 | 低背景噪音(家庭/办公室) | 102 | 1 | 10,417 | 要求可以办到 | 16. | 波 | 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用 每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域 与卡尔斯鲁厄理工学院(KIT)合作开发 |
葡萄牙语(巴西)麦克风 | |
221 | 文本 | ASR, TTS,语言建模 | N / A. | 98,000个单词 | 添加引用 | por_bra_pos. | Appen Global. | 词法词典 | 葡萄牙语 | 巴西 | N / A. | N / A. | N / A. | N / A. | 98000 | N / A. | 文本 | 葡萄牙语(巴西)词典的一部分 | ||
220 | 文本 | ASR, TTS,语言建模 | N / A. | 102,000字 | 添加引用 | 波鲁布拉丰 | Appen Global. | 发音字典 | 葡萄牙语 | 巴西 | N / A. | N / A. | N / A. | N / A. | 102000年 | N / A. | 文本 | 葡萄牙语(巴西)发音词典 | ||
79 | 音频 | ASR,会话AI,语音分析 | 手机和固定电话 | 36个小时 | 添加引用 | ptp_asr001. | Appen Global. | 会话演讲 | 葡萄牙语 | 葡萄牙 | 低背景噪音 | 200. | 2 | 要求可以办到 | 16339年 | 8. | 一条法律 | 数据集已完全转录和时间戳 数据集附有包含所有转录词的发音词典 该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池 |
葡萄牙语会话电话 | |
223 | 文本 | ASR, TTS,语言建模 | N / A. | 60,000字 | 添加引用 | por_PRT_POS | Appen Global. | 词法词典 | 葡萄牙语 | 葡萄牙 | N / A. | N / A. | N / A. | N / A. | 60,000 | N / A. | 文本 | 葡萄牙语(葡萄牙)词典的一部分 | ||
222 |