废弃货架数据集


我们的可授权数据集可以快速启动您的人工智能项目



图像

产品目录



虽然开放数据或公共数据集很方便,但我们提供了一个广泛的“现成的”目录,250多个授权数据集,跨越80种语言,跨越多种方言,用于各种常见的AI用例。我们很高兴地宣布30多个新的数据集,为我们的客户提供即时价值。在我们的产品中,您将发现用于语音识别的数据集,用于机器学习算法的学习数据集,所有这些都是使用最先进的可用数据科学创建的。




图像

速度



立即提供支持您的AI / ML项目


图像

成本效益



授权数据集比自定义数据收集更经济


图像

专业知识



20多年的数据收集体验


图像

支持所有数据类型



图像、视频、语音、音频和文本


图像

规模



提供适量的数据以有效培训您的模型

图像

质量



提高质量,最大限度地减少AI型号的偏差






数据集名称 产品类别 常用案件 记录装置 单位
数据集名称 产品类别 常用案件 记录装置 单位
135
向下箭头 产品类型ots-text 阿尔巴尼亚语发音词典
文本 ASR, TTS,语言建模 N / A. 12000字 添加引用 sqi_ALB_PHON Appen Global. 发音字典 阿尔巴尼亚 阿尔巴尼亚 N / A. N / A. N / A. N / A. 12,000 N / A. 文本 阿尔巴尼亚语发音词典
136
向下箭头 产品类型ots-text 阿姆哈拉语(埃塞俄比亚)发音词典
文本 ASR, TTS,语言建模 N / A. 45,000个字 添加引用 阿穆埃斯丰 Appen Global. 发音字典 阿姆哈里克 埃塞俄比亚 N / A. N / A. N / A. N / A. 45000年 N / A. 文本 阿姆哈拉语(埃塞俄比亚)发音词典
141
向下箭头 产品类型ots-text 阿拉伯语(阿尔及利亚)的发音词典
文本 ASR, TTS,语言建模 N / A. 11,000字 添加引用 ara_DZA_PHON Appen Global. 发音字典 阿拉伯 阿尔及利亚 N / A. N / A. N / A. N / A. 11,000 N / A. 文本 阿拉伯语(阿尔及利亚)的发音词典
20.
向下箭头 产品类型ots声音 阿拉伯语(阿尔及利亚东部)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 29个小时 添加引用 EAR_ASR001. Appen Global. 会话演讲 阿拉伯 阿尔及利亚 低背景噪音(家庭/办公室) 496. 2 要求可以办到 11,327 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
对于大多数呼叫来说,收集并转账都会收集和转账,对于较少数量的呼叫,只收集了一半的谈话并转录
阿拉伯语(阿尔及利亚东部)会话电话
137
向下箭头 产品类型ots-text 阿拉伯语(埃及)发音词典
文本 ASR, TTS,语言建模 N / A. 40,000字 添加引用 ara_egy_phon. Appen Global. 发音字典 阿拉伯 埃及 N / A. N / A. N / A. N / A. 40,000 N / A. 文本 阿拉伯语(埃及)发音词典
114
向下箭头 产品类型ots声音 阿拉伯语(埃及)脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 352小时 添加引用 ARE_ASR001_CN Appen中国 脚本演讲 阿拉伯 埃及 低背景噪音(家庭/办公室) 627. 1 128908年 207576年 16. 数据集包含带有相应文本提示的音频
文本提示不发元音
阿拉伯语(埃及)脚本智能手机
139
向下箭头 产品类型ots-text 阿拉伯语(伊拉克语)辞典部分
文本 ASR, TTS,语言建模 N / A. 13000个单词 添加引用 ARA_IRQ_POS. Appen Global. 词法词典 阿拉伯 伊拉克 N / A. N / A. N / A. N / A. 13,000. N / A. 文本 阿拉伯语(伊拉克语)辞典部分
138
向下箭头 产品类型ots-text 阿拉伯语(伊拉克)发音词典
文本 ASR, TTS,语言建模 N / A. 15000个单词 添加引用 ara_IRQ_PHON Appen Global. 发音字典 阿拉伯 伊拉克 N / A. N / A. N / A. N / A. 15000年 N / A. 文本 人的名字 阿拉伯语(伊拉克)发音词典
140
向下箭头 产品类型ots-text 阿拉伯语(利比亚)发音词典
文本 ASR, TTS,语言建模 N / A. 48,000个单词 添加引用 ara_LBY_PHON Appen Global. 发音字典 阿拉伯 利比亚 N / A. N / A. N / A. N / A. 48000年 N / A. 文本 阿拉伯语(利比亚)发音词典
65.
向下箭头 产品类型ots声音 阿拉伯语(现代标准阿拉伯语)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 12个小时 添加引用 MSA_ASR001 全球手机 脚本演讲 阿拉伯 突尼斯 低背景噪音(家庭/办公室) 78 1 4,908 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
阿拉伯语(现代标准阿拉伯语)脚本麦克风
112
向下箭头 产品类型ots声音 阿拉伯语(摩洛哥)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 33个小时 添加引用 ary_asr001. Appen Global. 会话演讲 阿拉伯 摩洛哥 低背景噪音 180 2 80,544 23,836 8. 一条法律 每位演讲者参与1 - 4次对话。扬声器由人口统计文件中记录的唯一的4位扬声器ID标识
抄写是可用的原始脚本和完全可逆的罗马字母版本与伴音词典
产品转录的英文翻译(ARY_MT001, ARY_ASRMT001)
阿拉伯语(摩洛哥)会话电话
113
向下箭头 产品类型ots-text 阿拉伯语(摩洛哥)会话电话翻译
文本 Mt,Chatbot,会话ai N / A. 80,544个话语 添加引用 ary_mt001 Appen Global. 对话翻译 阿拉伯 摩洛哥 N / A. 180 N / A. 80,430 23,844 N / A. 文本 提供相应的音频、转录、完全可逆的罗马化转录和发音词典数据(ARY_ASR001、ARY_ASRMT001) 阿拉伯语(摩洛哥)会话电话翻译
143
向下箭头 产品类型ots-text 阿拉伯语(摩洛哥)的发音词典
文本 ASR, TTS,语言建模 N / A. 60,000字 添加引用 ARA_MAR_PHON. Appen Global. 发音字典 阿拉伯 摩洛哥 N / A. N / A. N / A. N / A. 60,000 N / A. 文本 阿拉伯语(摩洛哥)的发音词典
144
向下箭头 产品类型ots-text 阿拉伯语(无)发音词典
文本 ASR, TTS,语言建模 N / A. 40,000字 添加引用 arb_N / A_PHON Appen Global. 发音字典 阿拉伯 N / A. N / A. N / A. N / A. N / A. 40,000 N / A. 文本 阿拉伯语(无)发音词典
115
向下箭头 产品类型ots声音 阿拉伯语(沙特阿拉伯)脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 322小时 添加引用 ARS_ASR001_CN. Appen中国 脚本演讲 阿拉伯 沙特阿拉伯 低背景噪音(家庭/办公室) 227 1 104574年 156282年 16. 数据集包含带有相应文本提示的音频
文本提示不发元音
300-1000提示每位发言者涵盖一般内容,包括教育,体育,娱乐,旅行,文化和技术
阿拉伯语(沙特阿拉伯)脚本智能手机
146
向下箭头 产品类型ots-text 阿拉伯语(苏丹语)发音词典
文本 ASR, TTS,语言建模 N / A. 17000个单词 添加引用 ARA_SDN_PHON. Appen Global. 发音字典 阿拉伯 苏丹 N / A. N / A. N / A. N / A. 17,000. N / A. 文本 阿拉伯语(苏丹语)发音词典
145
向下箭头 产品类型ots-text 阿拉伯语(阿拉伯联合酋长国(阿联酋))发音词典
文本 ASR, TTS,语言建模 N / A. 75,000字 添加引用 ara_ARE_PHON Appen Global. 发音字典 阿拉伯 阿拉伯联合酋长国(阿联酋) N / A. N / A. N / A. N / A. 75000年 N / A. 文本 阿拉伯语(阿拉伯联合酋长国(阿联酋))发音词典
120
向下箭头 产品类型ots声音 阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 170小时 添加引用 ARU_ASR001_CN Appen中国 脚本演讲 阿拉伯 阿拉伯联合酋长国(阿联酋) 低背景噪音(家庭/办公室) 133 1 42,352 85775年 16. 数据集包含带有相应文本提示的音频
文本提示不发元音
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本智能手机
70
向下箭头 产品类型ots声音 阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话
音频 ASR、虚拟助理 手机和固定电话 48小时 添加引用 阿拉伯联合酋长国东方MCA(现代阿拉伯口语) 细微差别 脚本演讲 阿拉伯 阿拉伯联合酋长国(阿联酋) 低背景噪音 880. 1 43000年 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
49每个扬声器提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富裕和单词和单词和自动的控制
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话
71
向下箭头 产品类型ots声音 阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话
音频 ASR、虚拟助理 手机和固定电话 31个小时 添加引用 OrienTel阿联酋MSA(现代标准阿拉伯语) 细微差别 脚本演讲 阿拉伯 阿拉伯联合酋长国(阿联酋) 低背景噪音 500 1 24,500. 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
49每个扬声器提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富裕和单词和单词和自动的控制
阿拉伯语(阿拉伯联合酋长国(阿联酋))脚本电话
9.
向下箭头 产品类型ots声音 阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 86小时 添加引用 cga_asr001. Appen Global. 脚本演讲 阿拉伯 阿拉伯联合酋长国(阿联酋) - 沙特阿拉伯 低背景噪音(家庭/办公室) 150 4. 42,000. 19245年 16. 一条法律 完全转录的声音事件标记源自于speech hdat约定
数据集附有包含所有转录词的发音词典
所有转录都完全压柔
280提示每个发言者包括30个人的名字(名和姓)从一组15,10个单一孤立的数字0-10,8位数字序列(随机生成),200个语音平衡的句子,30 x 10字语音平衡的单词字符串
阿拉伯语(阿拉伯联合酋长国/沙特阿拉伯)脚本麦克风
127
向下箭头 产品类型ots-text 阿拉伯语NER新闻文本
文本 ner,内容分类,搜索引擎 N / A. 20774句 添加引用 ARB_NER001. Appen Global. 新闻网 标准阿拉伯语 N / A. N / A. N / A. N / A. 20774年 要求可以办到 N / A. 文本 阿拉伯语NER新闻文本
147
向下箭头 产品类型ots-text assamese(印度)的发音词典
文本 ASR, TTS,语言建模 N / A. 40,000字 添加引用 asm_IND_PHON Appen Global. 发音字典 阿萨姆人的 印度 N / A. N / A. N / A. N / A. 40,000 N / A. 文本 assamese(印度)的发音词典
121
向下箭头 产品类型ots声音 婴儿哭了
音频 婴儿监视器,安全和其他消费者应用 手机 3小时 添加引用 cry_asr001. Appen中国 人体声音 N / A. 中国 低背景噪音(家庭/办公室) One hundred. 1 N / A. N / A. 16. 0-3岁婴儿的哭声,每次持续约2分钟。 婴儿哭了
4.
向下箭头 产品类型ots声音 印尼语会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 31个小时 添加引用 BAH_ASR001 Appen Global. 会话演讲 印度尼西亚 印尼 低背景噪音 1,002 2 30,695 11,480 8. 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
对于很大比例的电话,只有一半的通话被收集和记录
印尼语会话电话
150
向下箭头 产品类型ots-text 巴斯克(西班牙)的发音词典
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 eus_ESP_PHON Appen Global. 发音字典 巴斯克 西班牙 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 巴斯克(西班牙)的发音词典
6.
向下箭头 产品类型ots声音 孟加拉语(孟加拉国)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 47小时 添加引用 BEN_ASR001 Appen Global. 会话演讲 孟加拉语 孟加拉国 混合(车内、路边、家庭/办公室) 1,000 2 108923年 17,922 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
孟加拉语(孟加拉国)会话电话
151
向下箭头 产品类型ots-text 孟加拉语(印度)发音词典
文本 ASR, TTS,语言建模 N / A. 29,000字 添加引用 Ben_ind_Phon. Appen Global. 发音字典 孟加拉语 印度 N / A. N / A. N / A. N / A. 29000年 N / A. 文本 孟加拉语(印度)发音词典
7.
向下箭头 产品类型ots声音 保加利亚语(保加利亚)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 38小时 添加引用 bul_asr001. Appen Global. 会话演讲 保加利亚 保加利亚 低背景噪音(家庭/办公室) 217 2 86,453 22342年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
保加利亚语(保加利亚)会话电话
152
向下箭头 产品类型ots-text 保加利亚语(保加利亚)的发音词典
文本 ASR, TTS,语言建模 N / A. 55000个单词 添加引用 bul_BGR_PHON Appen Global. 发音字典 保加利亚 保加利亚 N / A. N / A. N / A. N / A. 55000年 N / A. 文本 保加利亚语(保加利亚)的发音词典
111
向下箭头 产品类型ots声音 保加利亚语(保加利亚)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 22小时 添加引用 bul_asr002. 全球手机 脚本演讲 保加利亚 保加利亚 低背景噪音(家庭/办公室) 77 1 8,674 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
保加利亚语(保加利亚)脚本麦克风
268
向下箭头 产品类型OTS-Image 企业对企业打印文本文档OCR
图像 文档处理,文档搜索 相机,扫描 4362份文件 添加引用 IMG_OCR_B2B. Appen Global. 文档OCR N / A. N / A. 混合照明条件 N / A. N / A. N / A. N / A. N / A. jpg. 包含打印文本的企业对企业文件的扫描和照片。48%优质图片,包括采购订单,付款通知或汇款通知,订单确认和送货单;52%标准质量图像在各种困难条件下的各种类别,包括投诉或退货、发货通知、发货通知单、催收、收货收据、发票、报盘、订单确认、付款凭条、付款通知或汇款通知、采购订单、收据和供应商装载 企业对企业打印文本文档OCR
269
向下箭头 产品类型OTS-Image 业务对消费者/其他文本文档OCR
图像 文档处理,文档搜索 相机,扫描 26020份文件 添加引用 IMG\u OCR\u B2C\u其他 Appen Global. 文档OCR N / A. N / A. 混合照明条件 N / A. N / A. N / A. N / A. N / A. jpg. 商家对消费者的扫描和照片以及其他包含文字的类别文件:37%的发票,42%的收据,1%的表格文件,2%的手写表格和文件,2%的菜单,11%的产品标签,2%的海报,3%的路牌。在23个以上地区收集的6种语言:11%的阿拉伯语,43%的英语,4%的法语,4%的德语,24%的西班牙语,14%的俄语 业务对消费者/其他文本文档OCR
155
向下箭头 产品类型ots-text 粤语(中国)言语字典的一部分
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 yue_hkg_pos. Appen Global. 词法词典 广东话 中国 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 传统的 粤语(中国)言语字典的一部分
153
向下箭头 产品类型ots-text 粤语(中国)发音词典
文本 ASR, TTS,语言建模 N / A. 37000字 添加引用 yue_CHN_PHON Appen Global. 发音字典 广东话 中国 N / A. N / A. N / A. N / A. 37000年 N / A. 文本 简化 粤语(中国)发音词典
154
向下箭头 产品类型ots-text 粤语(中国)发音词典
文本 ASR, TTS,语言建模 N / A. 40,000字 添加引用 yue_CHN_PHON Appen Global. 发音字典 广东话 中国 N / A. N / A. N / A. N / A. 40,000 N / A. 文本 传统的 粤语(中国)发音词典
156
向下箭头 产品类型ots-text 加泰罗尼亚人(西班牙)的发音词典
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 cat_ESP_PHON Appen Global. 发音字典 加泰罗尼亚语的 西班牙 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 加泰罗尼亚人(西班牙)的发音词典
157
向下箭头 产品类型ots-text (菲律宾)发音字典
文本 ASR, TTS,语言建模 N / A. 20,000个字 添加引用 CEB_PHL_PHON. Appen Global. 发音字典 CEBUANO. 菲律宾 N / A. N / A. N / A. N / A. 20,000 N / A. 文本 (菲律宾)发音字典
265
向下箭头 产品类型ots声音 中文(外国人)(多国)脚本演讲
音频 ASR,会话AI,语音分析 手机 200小时 添加引用 外国人_asr001_cn. Appen中国 脚本演讲 中文(外国人) 跨国公司 低背景噪音 309. 1 16. 此数据库包含200小时的外国人从以下国家说中文:阿根廷,埃及,澳大利亚,俄罗斯,菲律宾,哈萨克斯坦,韩国,吉尔吉斯斯坦,加拿大,吉隆坡,肯尼亚,老挝,马来西亚,毛里求斯,美国,蒙古,美国,美国,美国,美国,蒙古,南非,日本,塔吉克斯坦,泰国,土耳其,香港,新加坡,印度,印度尼西亚,越南
没有来自韩国、巴西或未成年人的数据记录。
每一节持续约1小时;句子持续时间在3-10秒之间
内容是个人阅读的形式,同时在家庭/办公环境中记录在移动电话上。
敏感数据和个人信息已被擦洗。
中文(外国人)(多国)脚本演讲
10.
向下箭头 产品类型ots声音 克罗地亚语(克罗地亚)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 39小时 添加引用 CRO_ASR001 Appen Global. 会话演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 200. 2 要求可以办到 23919年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
克罗地亚语(克罗地亚)会话电话
158
向下箭头 产品类型ots-text 克罗地亚语发音词典
文本 ASR, TTS,语言建模 N / A. 20,000个字 添加引用 hrv_hrv_phon. Appen Global. 发音字典 克罗地亚 克罗地亚 N / A. N / A. N / A. N / A. 20,000 N / A. 文本 克罗地亚语发音词典
11.
向下箭头 产品类型ots声音 克罗地亚语(克罗地亚)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 11个小时 添加引用 CRO_ASR002 全球手机 脚本演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 94 1 4499年 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
克罗地亚语(克罗地亚)脚本麦克风
116
向下箭头 产品类型ots声音 克罗地亚脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 263小时 添加引用 CRO\ U ASR003\中国 Appen中国 脚本演讲 克罗地亚 克罗地亚 低背景噪音(家庭/办公室) 243 1 73467年 136,140 16. 数据集包含带有相应文本提示的音频 克罗地亚脚本智能手机
159
向下箭头 产品类型ots-text 捷克(捷克共和国)发音词典
文本 ASR, TTS,语言建模 N / A. 50000个单词 添加引用 塞斯切芬 Appen Global. 发音字典 捷克语 捷克共和国 N / A. N / A. N / A. N / A. 50,000. N / A. 文本 捷克(捷克共和国)发音词典
12.
向下箭头 产品类型ots声音 捷克语(捷克共和国)脚本话筒
音频 ASR,虚拟助手,Chatbot 麦克风 31个小时 添加引用 CZE_ASR001 全球手机 脚本演讲 捷克语 捷克共和国 低背景噪音(家庭/办公室) 102 1 12,425 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
捷克语(捷克共和国)脚本话筒
13.
向下箭头 产品类型ots声音 捷克(捷克共和国)脚本电话
音频 ASR、虚拟助理 仅固定电话 93小时 添加引用 捷克语音DAT(e)数据集 细微差别 脚本演讲 捷克语 捷克共和国 低背景噪音 1,000 1 52000年 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
52每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,以及语音富裕的单词和句子
捷克(捷克共和国)脚本电话
161
向下箭头 产品类型ots-text 《丹麦语词典》
文本 ASR, TTS,语言建模 N / A. 10万字 添加引用 dan\u DNK\u位置 Appen Global. 词法词典 丹麦 丹麦 N / A. N / A. N / A. N / A. 100,000 N / A. 文本 《丹麦语词典》
160
向下箭头 产品类型ots-text 丹麦语(丹麦)发音词典
文本 ASR, TTS,语言建模 N / A. 107000个单词 添加引用 dan_dnk_phon. Appen Global. 发音字典 丹麦 丹麦 N / A. N / A. N / A. N / A. 107,000. N / A. 文本 丹麦语(丹麦)发音词典
90
向下箭头 产品类型ots声音 丹麦语(丹麦)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 53小时 添加引用 Speecon丹麦 细微差别 脚本演讲 丹麦 丹麦 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
丹麦语(丹麦)脚本麦克风
15.
向下箭头 产品类型ots声音 达里(阿富汗)播出
音频 ASR,自动标题,关键字斑点 麦克风 51小时 添加引用 DAR_BRC001 Appen Global. 广播演讲 达里语 阿富汗 低背景噪音(演播室) N / A. 1 要求可以办到 要求可以办到 N / A. 数据集已完全转录和时间戳
目前没有发音词典,但可根据要求开发
数据集主要是语音,不包括音乐和广告
数据类型包括:谈话节目,访谈,新闻广播(不包括锚的新闻读数)
达里(阿富汗)播出
14.
向下箭头 产品类型ots声音 达里(阿富汗)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 40小时 添加引用 DAR_ASR001 Appen Global. 会话演讲 达里语 阿富汗 低背景噪音 500 2 要求可以办到 11168年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
数据集主要是语音,不包括音乐和广告
达里(阿富汗)会话电话
162
向下箭头 产品类型ots-text 达里(阿富汗)发音词典
文本 ASR, TTS,语言建模 N / A. 30000个单词 添加引用 prs_AFG_PHON Appen Global. 发音字典 达里语 阿富汗 N / A. N / A. N / A. N / A. 30000年 N / A. 文本 达里(阿富汗)发音词典
163
向下箭头 产品类型ots-text Dholuo(肯尼亚)发音词典
文本 ASR, TTS,语言建模 N / A. 20,000个字 添加引用 luo_ken_phon. Appen Global. 发音字典 Doluo. 肯尼亚 N / A. N / A. N / A. N / A. 20,000 N / A. 文本 Dholuo(肯尼亚)发音词典
258
向下箭头 产品类型ots声音 东北方言(中国)会话用语
音频 ASR,会话AI,语音分析 记录笔/麦克风 84.6小时 添加引用 dongbei_asr001_cn. Appen中国 会话演讲 东北方言 中国 低背景噪音 268 1 16. 音频;不包括转录
录音资料覆盖19个地区:沈阳市和平区、沈河区、皇姑区、大东区、铁西区、绿园区、朝阳区、宽城区、二道区、南关区、道里区、南岗区、道外区、平房区、松北区、香坊区、呼兰区、阿城区、双城区
东北郊区口音不包括在内,没有未成年人的记录。
每个录音会话包含20-30分钟的免费对话,在2-5人之间。
敏感数据和个人信息已被擦洗。
东北方言(中国)会话用语
259
向下箭头 产品类型ots声音 东北方言(中国)会话用语
音频 ASR,会话AI,语音分析 手机 75.2小时 添加引用 DONGBEI_ASR002_CN Appen中国 会话演讲 东北方言 中国 低背景噪音 185 1 8. 音频;不包括转录
录音资料覆盖19个地区:沈阳市和平区、沈河区、皇姑区、大东区、铁西区、绿园区、朝阳区、宽城区、二道区、南关区、道里区、南岗区、道外区、平房区、松北区、香坊区、呼兰区、阿城区、双城区
东北郊区口音不包括在内,没有未成年人的记录。
每个录音会话包含20-30分钟的免费对话,在2-5人之间。
敏感数据和个人信息已被擦洗。
东北方言(中国)会话用语
91
向下箭头 产品类型ots声音 荷兰语(比利时)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 47小时 添加引用 比利时荷兰语演讲 细微差别 脚本演讲 荷兰的 比利时 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
荷兰语(比利时)脚本麦克风
33.
向下箭头 产品类型ots声音 荷兰语(比利时)脚本电话
音频 ASR、虚拟助理 麦克风 80小时 添加引用 佛兰芒语音DAT(ii)FDB-1000(固定射线) 细微差别 脚本演讲 荷兰的 比利时 低背景噪音 1,000 1 52000年 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个说话人52个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词以及自动控制项
荷兰语(比利时)脚本电话
19.
向下箭头 产品类型ots声音 荷兰人(荷兰和比利时)脚本车内
音频 ASR,虚拟助手,汽车HMI和娱乐 麦克风和手机 27小时 添加引用 荷兰语和佛兰德语的演讲车 细微差别 脚本演讲 荷兰的 荷兰-比利时 混合(车内) 302. 5. 15100年 要求可以办到 16和8. 一条法律 数据集是完全转录的,并伴随着发音词典和验证报告
每名成人演讲者会有125个提示,包括数字、自然数字、字母串、个人、地点和商业名称(有些是自发的)、通用的命令和控制项目、语音丰富的单词和句子以及自发讲话的提示
荷兰人(荷兰和比利时)脚本车内
66.
向下箭头 产品类型ots声音 荷兰(荷兰)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 36个小时 添加引用 NLD_ASR001 Appen Global. 会话演讲 荷兰的 荷兰 低背景噪音 200. 2 要求可以办到 14,964 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
荷兰(荷兰)会话电话
164
向下箭头 产品类型ots-text 荷兰语(荷兰)的发音词典
文本 ASR, TTS,语言建模 N / A. 45,000个字 添加引用 nld_nld_phon. Appen Global. 发音字典 荷兰的 荷兰 N / A. N / A. N / A. N / A. 45000年 N / A. 文本 荷兰语(荷兰)的发音词典
92
向下箭头 产品类型ots声音 荷兰语(荷兰)脚本话筒
音频 ASR,虚拟助手,Chatbot 麦克风 68小时 添加引用 荷兰语,来自荷兰 细微差别 脚本演讲 荷兰的 荷兰 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
荷兰语(荷兰)脚本话筒
122
向下箭头 产品类型OTS-Image 东非面部影像
图像 面部识别 相机 14948张图片 添加引用 IMG_FACE_KEN_CN Appen中国 人类的脸 N / A. 肯尼亚 混合背景和照明条件 99 N / A. N / A. N / A. N / A. jpg. 图片包含9种不同光线条件的所有组合,参与者面部和智能手机之间的2种不同距离,7种不同的摄像角度
每个人随机选取32张图片,包括太阳镜、面具、假发或帽子等遮挡物
随机拍摄的36张照片包含不同的面部表情,包括凝视、张嘴、撅嘴、微笑和皱眉
照明条件:室内正常灯,户外普通灯,室内背光,室外背光,室内普通深光,全黑屏填充光,点光源(白光,路灯),霓虹灯,侧眩光)
摄像头角度:前、左45°、右45°、左15°、右15°、上30°、下30°
东非面部影像
21.
向下箭头 产品类型ots声音 英语(阿拉伯语 - Levant /埃及)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 28小时 添加引用 ENA_ASR001. Appen Global. 会话演讲 英语 埃及 低背景噪音 250 2 要求可以办到 5,619 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
平均通话时长:10-15分钟
英语(阿拉伯语 - Levant /埃及)会话电话
166
向下箭头 产品类型ots-text 英语(澳洲)发音字典
文本 ASR, TTS,语言建模 N / A. 157,000字 添加引用 eng_AUS_PHON Appen Global. 发音字典 英语 澳大利亚 N / A. N / A. N / A. N / A. 157,000. N / A. 文本 英语(澳洲)发音字典
2
向下箭头 产品类型ots声音 英语(澳大利亚)脚本电话
音频 ASR、虚拟助理 手机和固定电话 92小时 添加引用 aus_asr001. Appen Global. 脚本演讲 英语 澳大利亚 低背景噪音(家庭/办公室) 500 1 82500年 35,137 8. 一条法律 完全转录为Speathdat类型约定
数据集附有包含所有转录词的发音词典
每个说话人162个提示(朗读语音),包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项(来自215个)、语音丰富的句子和单词
英语(澳大利亚)脚本电话
3.
向下箭头 产品类型ots声音 英语(澳大利亚)脚本电话
音频 ASR、虚拟助理 手机和固定电话 118小时 添加引用 aus_asr002. Appen Global. 脚本演讲 英语 澳大利亚 混合 1,000 1 75000年 18,952 8. 一条法律 完全转录为Speathdat类型约定
数据集附有包含所有转录词的发音词典
每个说话人有75个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词
提示是“读”和“引起的”项目的混合,其中5个每脚本的提示是“自发的免费演讲”
英语(澳大利亚)脚本电话
168
向下箭头 产品类型ots-text 英语(加拿大)语音词典的一部分
文本 ASR, TTS,语言建模 N / A. 3000个单词 添加引用 eng_CAN_POS Appen Global. 词法词典 英语 加拿大 N / A. N / A. N / A. N / A. 3,000 N / A. 文本 英语(加拿大)语音词典的一部分
167
向下箭头 产品类型ots-text 英语(加拿大)发音字典
文本 ASR, TTS,语言建模 N / A. 50000个单词 添加引用 eng_can_phon. Appen Global. 发音字典 英语 加拿大 N / A. N / A. N / A. N / A. 50,000. N / A. 文本 英语(加拿大)发音字典
22.
向下箭头 产品类型ots声音 英语(加拿大)脚本电话
音频 ASR、虚拟助理 手机和固定电话 144小时 添加引用 ENC_ASR001 Appen Global. 脚本演讲 英语 加拿大 混合 1,000 1 99,000 12,483 8. 法律或wav 完全转录到Sala II / SpeemDAT类型的惯例
数据集附有包含所有转录词的发音词典
每个发言者有99个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词
英语(加拿大)脚本电话
170
向下箭头 产品类型ots-text 英语(香港)发音词典
文本 ASR, TTS,语言建模 N / A. 18,000字 添加引用 eng_HKG_PHON Appen Global. 发音字典 英语 香港 N / A. N / A. N / A. N / A. 18000年 N / A. 文本 英语(香港)发音词典
271
向下箭头 产品类型ots声音 英语(印度)会话智能手机
音频 ASR,会话AI,语音分析 手机 143小时 添加引用 ENI_ASR003. Appen Global. 会话演讲 英语 印度 混合(家庭、汽车、公共场所、户外) 272 1 要求可以办到 要求可以办到 16. 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。
每位演讲者参与长达5-15分钟的12次对话。
目前没有发音词典,但可根据要求开发
英语(印度)会话智能手机
25.
向下箭头 产品类型ots声音 英语(印度)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 67小时 添加引用 ENI_ASR002. Appen Global. 会话演讲 英语 印度 低背景噪音 540 2 77565年 11646年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
本项目共记录了271次电话通话
英语(印度)会话电话
172
向下箭头 产品类型ots-text 英语(印度)辞典部分
文本 ASR, TTS,语言建模 N / A. 13000个单词 添加引用 eng_IND_POS Appen Global. 词法词典 英语 印度 N / A. N / A. N / A. N / A. 13,000. N / A. 文本 英语(印度)辞典部分
171
向下箭头 产品类型ots-text 英语(印度)发音词典
文本 ASR, TTS,语言建模 N / A. 60,000字 添加引用 eng_IND_PHON Appen Global. 发音字典 英语 印度 N / A. N / A. N / A. N / A. 60,000 N / A. 文本 英语(印度)发音词典
24.
向下箭头 产品类型ots声音 英语(印度)脚本电话
音频 ASR、虚拟助理 手机和固定电话 217小时 添加引用 ENI_ASR001. Appen Global. 脚本演讲 英语 印度 混合 2,358 1 117,900. 9190年 8. 一条法律 完全转录到speech hdat类型约定。
数据集伴随着包含所有转录单词的发音词典[SAMPA]
每个说话人49个提示,包括数字、自然数、字母串、人名、地名和商号、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词
英语(印度)脚本电话
173
向下箭头 产品类型ots-text 英语(爱尔兰)发音词典
文本 ASR, TTS,语言建模 N / A. 12000字 添加引用 eng_IRL_PHON Appen Global. 发音字典 英语 爱尔兰 N / A. N / A. N / A. N / A. 12,000 N / A. 文本 英语(爱尔兰)发音词典
174
向下箭头 产品类型ots-text 英语(新西兰)发音词典
文本 ASR, TTS,语言建模 N / A. 50000个单词 添加引用 eng_NZL_PHON Appen Global. 发音字典 英语 NZ. N / A. N / A. N / A. N / A. 50,000. N / A. 文本 英语(新西兰)发音词典
23.
向下箭头 产品类型ots声音 英语(菲律宾)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 53小时 添加引用 ENF_ASR001. Appen Global. 会话演讲 英语 菲律宾 低背景噪音 450. 2 41,602 7272年 8. 法律或wav 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
平均通话时长:10-15分钟
英语(菲律宾)会话电话
169
向下箭头 产品类型ots-text 英语(菲律宾)发音词典
文本 ASR, TTS,语言建模 N / A. 5000个单词 添加引用 eng_phl_phon. Appen Global. 发音字典 英语 菲律宾 N / A. N / A. N / A. N / A. 5000 N / A. 文本 英语(菲律宾)发音词典
165
向下箭头 产品类型ots-text 英语(阿拉伯联合酋长国(阿联酋))发音词典
文本 ASR, TTS,语言建模 N / A. 5000个单词 添加引用 Eng_are_Phon. Appen Global. 发音字典 英语 阿拉伯联合酋长国(阿联酋) N / A. N / A. N / A. N / A. 5000 N / A. 文本 英语(阿拉伯联合酋长国(阿联酋))发音词典
67.
向下箭头 产品类型ots声音 英语(阿拉伯联合酋长国(阿联酋))脚本电话
音频 ASR、虚拟助理 手机和固定电话 33个小时 添加引用 阿拉伯联合酋长国说的东方英语 细微差别 脚本演讲 英语 阿拉伯联合酋长国(阿联酋) 低背景噪音 500 1 25500年 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
51每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目,语音富句和单词和自发项目进行控制
英语(阿拉伯联合酋长国(阿联酋))脚本电话
104
向下箭头 产品类型ots声音 英语(英国)电话会话
音频 ASR,会话AI,语音分析 手机和固定电话 150小时 添加引用 UKE_ASR001 Appen Global. 会话演讲 英语 英国 低背景噪音 1150年 2 298,562 24193年 8. 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
英语(英国)电话会话
255
向下箭头 产品类型ots声音 英语(英国)电话会话
音频 ASR,会话AI,语音分析 手机和固定电话 50个小时 添加引用 UKE_ASR001B Appen Global. 会话演讲 英语 英国 低背景噪音 1150年 2 要求可以办到 13192年 8. 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
英语(英国)电话会话
176
向下箭头 产品类型ots-text 英语(英国)词汇词典部分
文本 ASR, TTS,语言建模 N / A. 155000个单词 添加引用 eng_GBR_POS Appen Global. 词法词典 英语 英国 N / A. N / A. N / A. N / A. 155000年 N / A. 文本 英语(英国)词汇词典部分
175
向下箭头 产品类型ots-text 英语(英国)发音词典
文本 ASR, TTS,语言建模 N / A. 195,000个单词 添加引用 Eng_gbr_phon. Appen Global. 发音字典 英语 英国 N / A. N / A. N / A. N / A. 195,000 N / A. 文本 英语(英国)发音词典
99
向下箭头 产品类型ots声音 英语(英国)脚本麦克风 - 单身女性
音频 TTS. 耳机麦克风 11个小时 添加引用 TC-STAR女性基线声音劳拉 细微差别 脚本演讲 英语 英国 低背景噪音(演播室) 1 1 要求可以办到 要求可以办到 96 要求可以办到 数据集包括手动正交转录,自动分割成音素,自动生成音调标记(其中手动检查一定百分比的语音段和音调标记)
数据集附有一个带有词缀、引理和标音的发音词典
英语(英国)脚本麦克风 - 单身女性
One hundred.
向下箭头 产品类型ots声音 英语(英国)脚本麦克风-单身男性
音频 TTS. 耳机麦克风 7个小时 添加引用 TC-STAR男性基线声音Ian 细微差别 脚本演讲 英语 英国 低背景噪音(演播室) 1 1 要求可以办到 要求可以办到 96 要求可以办到 数据集包括手动正交转录,自动分割成音素,自动生成音调标记(其中手动检查一定百分比的语音段和音调标记)
数据集附有一个带有词缀、引理和标音的发音词典
英语(英国)脚本麦克风-单身男性
272
向下箭头 产品类型ots声音 英语(美国 - 非洲裔美国人)会话智能手机
音频 ASR,会话AI,语音分析 手机 50个小时 添加引用 USE_ASR004 Appen Global. 会话演讲 英语 美国 混合(家庭、汽车、公共场所、户外) 要求可以办到 1 要求可以办到 要求可以办到 16. 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。
每位演讲者参与长达5-15分钟的12次对话。
目前没有发音词典,但可根据要求开发
英语(美国 - 非洲裔美国人)会话智能手机
266
向下箭头 产品类型ots-text 英语(美国)对话短信 - 线程
文本 虚拟助手,Chatbot N / A. 952,677消息 添加引用 ENG_SMS001 Appen Global. SMS文本消息 英语 美国 N / A. 要求可以办到 N / A. 952677年 要求可以办到 N / A. 文本 该数据集包含2个参与者之间的线程短信对话,使用iMessage和Android短信。所有的信息都是美式英语。包含时间戳和文本信息交换,元数据包括性别、年龄范围和参与者之间的关系。从所有参与者获得同意,数据集不包含PII。 英语(美国)对话短信 - 线程
267
向下箭头 产品类型ots-text 英语(美国)对话短信 - 线程
文本 虚拟助手,Chatbot N / A. 106649条信息 添加引用 ENG_SMS001A Appen Global. SMS文本消息 英语 美国 N / A. 390. N / A. 106,649. 要求可以办到 N / A. 文本 这是ENG_SMS001的子集。该数据集包含2个参与者之间的线程短信对话,使用iMessage和Android短信。所有的信息都是美式英语。包含时间戳和文本信息交换,元数据包括性别、年龄范围和参与者之间的关系。从所有参与者获得同意,数据集不包含PII。 英语(美国)对话短信 - 线程
270
向下箭头 产品类型ots-text 英语(美国)对话WhatsApp -线程
文本 虚拟助手,Chatbot N / A. 351,826消息 添加引用 ENG_SMS002 Appen Global. WhatsApp短信 英语 美国 N / A. 要求可以办到 N / A. 351826年 要求可以办到 N / A. 文本 此数据集包含两个参与者之间使用WhatsApp的线程文本消息对话。所有信息都是美式英语。包含时间戳和文本消息交换,元数据包括性别、年龄范围和参与者之间的关系。获得所有参与者的同意,数据集不包含PII。 英语(美国)对话WhatsApp -线程
107
向下箭头 产品类型ots声音 英语(美国)会话智能手机
音频 ASR,会话AI,语音分析 手机 1000小时 添加引用 USE_ASR003 Appen Global. 会话演讲 英语 美国 低背景噪音 2,000 1 500000年 52586年 16. 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
对话的话题非常广泛,包括:学习/专业/工作、家乡、生活安排、天气和季节、准时、电视节目/电影)
英语(美国)会话智能手机
178
向下箭头 产品类型ots-text 英语(美国)辞典部分
文本 ASR, TTS,语言建模 N / A. 263000个单词 添加引用 eng_USA_POS Appen Global. 词法词典 英语 美国 N / A. N / A. N / A. N / A. 263,000. N / A. 文本 英语(美国)辞典部分
177
向下箭头 产品类型ots-text 英语(美国)发音词典
文本 ASR, TTS,语言建模 N / A. 330000个单词 添加引用 Eng_USA_PHON. Appen Global. 发音字典 英语 美国 N / A. N / A. N / A. N / A. 33万 N / A. 文本 英语(美国)发音词典
93
向下箭头 产品类型ots声音 英语(美国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 53小时 添加引用 speech English (USA)数据库 细微差别 脚本演讲 英语 美国 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
英语(美国)脚本麦克风
106
向下箭头 产品类型ots声音 英语(美国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 62小时 添加引用 USE_ASR001 Appen Global. 脚本演讲 英语 美国 低背景噪音(演播室) 200. 2 80000年 18,318 48. 法律或wav 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
每个扬声器读取400个提示,包括数字,自然数,个人和城市名称,电话号码,通用命令和控制项目,语音富裕的句子和单词
英语(美国)脚本麦克风
128
向下箭头 产品类型ots-text 英语NER新闻文本
文本 ner,内容分类,搜索引擎 N / A. 22,768句 添加引用 Eng_ner001. Appen Global. 新闻网 英语 N / A. N / A. N / A. N / A. 22768年 要求可以办到 N / A. 文本 英语NER新闻文本
132
向下箭头 产品类型ots-text 波斯语/波斯语新闻文本
文本 ner,内容分类,搜索引擎 N / A. 19584句 添加引用 FAR_NER001 Appen Global. 新闻网 伊朗波斯语 伊朗 N / A. N / A. N / A. 19,584 要求可以办到 N / A. 文本 波斯语/波斯语新闻文本
182
向下箭头 产品类型ots-text 芬兰语(芬兰)的言语字典的一部分
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 fin_fin_pos. Appen Global. 词法词典 芬兰 芬兰 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 芬兰语(芬兰)的言语字典的一部分
125
向下箭头 产品类型OTS-Image 芬兰文(芬兰)印刷文字OCR
图像 文档处理,文档搜索 相机 7293张图片 添加引用 IMG_OCR_FIN_CN. Appen中国 文档OCR 芬兰 芬兰 混合照明条件 4. N / A. N / A. N / A. N / A. jpg. 包含文字的图像,如广告牌/外包装/标牌/杂志/菜单等 芬兰文(芬兰)印刷文字OCR
181
向下箭头 产品类型ots-text 芬兰语(芬兰)的发音词典
文本 ASR, TTS,语言建模 N / A. 85,000个字 添加引用 fin_FIN_PHON Appen Global. 发音字典 芬兰 芬兰 N / A. N / A. N / A. N / A. 85,000. N / A. 文本 芬兰语(芬兰)的发音词典
142
向下箭头 产品类型ots-text 法语(阿尔及利亚)发音词典
文本 ASR, TTS,语言建模 N / A. 4000个单词 添加引用 fra_DZA_PHON Appen Global. 发音字典 法国 阿尔及利亚 N / A. N / A. N / A. N / A. 4000年 N / A. 文本 阿拉伯语字母 法语(阿尔及利亚)发音词典
5.
向下箭头 产品类型ots声音 法语(比利时)脚本电话
音频 ASR、虚拟助理 仅固定电话 76小时 添加引用 比利时法语语音dat (II) FDB-1000 (FIXED1BF) 细微差别 脚本演讲 法国 比利时 低背景噪音 1,000 1 53000年 要求可以办到 8. 一条法律 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目,语音丰富的句子和单词和自发的控制项目
法语(比利时)脚本电话
36.
向下箭头 产品类型ots声音 法语(加拿大)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 9小时 添加引用 FRC_ASR003 Appen Global. 会话演讲 法国 加拿大 混合 68. 2 要求可以办到 6022年 8. 一条法律 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
平均通话时长:10-15分钟
对于大多数电话,只有一半的通话被收集和转录,然而,对于较少数量的电话,两个扬声器(内/外)都被收集和转录
法语(加拿大)会话电话
183
向下箭头 产品类型ots-text 法语(加拿大)的发音词典
文本 ASR, TTS,语言建模 N / A. 67000个单词 添加引用 fra_CAN_PHON Appen Global. 发音字典 法国 加拿大 N / A. N / A. N / A. N / A. 67000年 N / A. 文本 法语(加拿大)的发音词典
35.
向下箭头 产品类型ots声音 法语(加拿大)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 46小时 添加引用 FRC_ASR002 Appen Global. 脚本演讲 法国 加拿大 低背景噪音(家庭/办公室) 150 1 22,500. 10755年 16. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
150每个扬声器提示包括数字,数字字符串(随机生成),地址和语音富裕句子和单词
法语(加拿大)脚本麦克风
34.
向下箭头 产品类型ots声音 法语(加拿大)脚本电话
音频 ASR、虚拟助理 手机 131小时 添加引用 FRC_ASR001 Appen Global. 脚本演讲 法国 加拿大 混合 1,000 1 100,000 11,697 8. 一条法律 完全转录为Speathdat类型约定
数据集伴随着包含所有转录单词的发音词典[SAMPA]
每个发言者100个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词
法语(加拿大)脚本电话
275
向下箭头 产品类型ots声音 法语(法国)会话智能手机
音频 ASR,会话AI,语音分析 手机 159小时 添加引用 FRF_ASR004 Appen Global. 会话演讲 法国 法国 混合(家庭、汽车、公共场所、户外) 298 1 要求可以办到 要求可以办到 16. 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。
每位演讲者参与长达5-15分钟的12次对话。
目前没有发音词典,但可根据要求开发
法语(法国)会话智能手机
40
向下箭头 产品类型ots声音 法国(法国)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 25小时 添加引用 FRF_ASR001 Appen Global. 会话演讲 法国 法国 低背景噪音 563 2 要求可以办到 11922年 8. 一条法律 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录
法国(法国)会话电话
39.
向下箭头 产品类型ots声音 法国(法国)车内
音频 ASR,虚拟助手,汽车HMI和娱乐 麦克风和手机 113小时 添加引用 法国演说 - 汽车 细微差别 脚本演讲 法国 法国 混合(车内) 300 5. 37,500 要求可以办到 16和8. 要求可以办到 数据集是完全转录的,并伴随着发音词典和验证报告
每个演讲者大约有125个提示,包括数字、自然数字、字母串、个人、地点和企业名称(有些是自发的)、通用的命令和控制项、语音丰富的单词和句子以及自发讲话的提示
113.7小时
法国(法国)车内
185
向下箭头 产品类型ots-text 《法语词汇词典》
文本 ASR, TTS,语言建模 N / A. 95,000字 添加引用 fra\ U fra\ U位置 Appen Global. 词法词典 法国 法国 N / A. N / A. N / A. N / A. 95000年 N / A. 文本 《法语词汇词典》
184
向下箭头 产品类型ots-text 法语发音词典
文本 ASR, TTS,语言建模 N / A. 112,000字 添加引用 fra_fra_phon. Appen Global. 发音字典 法国 法国 N / A. N / A. N / A. N / A. 112,000 N / A. 文本 法语发音词典
41.
向下箭头 产品类型ots声音 法语(法国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 26小时 添加引用 FRF_ASR003 全球手机 脚本演讲 法国 法国 低背景噪音(家庭/办公室) 98 1 10273年 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
法语(法国)脚本麦克风
37.
向下箭头 产品类型ots声音 法国(法国)脚本电话
音频 ASR、虚拟助理 仅固定电话 41小时 添加引用 法国SpeechDat (II)身上- 1000 细微差别 脚本演讲 法国 法国 低背景噪音(家庭/办公室) 1,017 1 48000年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词
法国(法国)脚本电话
38.
向下箭头 产品类型ots声音 法国(法国)脚本电话
音频 ASR、虚拟助理 仅固定电话 305小时 添加引用 法语SpeemDAT(ii)FDB-5000 细微差别 脚本演讲 法国 法国 低背景噪音 5,040 1 237,000 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
47每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词
法国(法国)脚本电话
60.
向下箭头 产品类型ots声音 法语(卢森堡)电话
音频 ASR、虚拟助理 仅固定电话 45个小时 添加引用 卢森堡法国语音(ii)FDB-500(固定地1LF) 细微差别 脚本演讲 法国 卢森堡 低背景噪音 614. 1 32,000 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词
法语(卢森堡)电话
273
向下箭头 产品类型ots声音 德国(德国)会话智能手机
音频 ASR,会话AI,语音分析 手机 104小时 添加引用 deu_asr004. Appen Global. 会话演讲 德国的 德国 混合(家庭、汽车、公共场所、户外) 198 1 要求可以办到 要求可以办到 16. 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。
每位演讲者参与长达5-15分钟的12次对话。
目前没有发音词典,但可根据要求开发
德国(德国)会话智能手机
186
向下箭头 产品类型ots-text 德语发音词典
文本 ASR, TTS,语言建模 N / A. 146,000个单词 添加引用 deu_deu_phon. Appen Global. 发音字典 德国的 德国 N / A. N / A. N / A. N / A. 146000年 N / A. 文本 德语发音词典
16.
向下箭头 产品类型ots声音 德国(德国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 16个小时 添加引用 deu_asr001. Appen Global. 脚本演讲 德国的 德国 低背景噪音(演播室) 127 2 12700年 6826年 16. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
每位演讲者朗读100个提示,包括数字、自然数字、人名和城市名、电话号码、通用命令和控制项、语音丰富的句子和单词
德国(德国)脚本麦克风
18.
向下箭头 产品类型ots声音 德国(德国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 25小时 添加引用 deu_asr003. 全球手机 脚本演讲 德国的 德国 低背景噪音(家庭/办公室) 77 1 10085年 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
德国(德国)脚本麦克风
42.
向下箭头 产品类型ots声音 德国(德国)电话
音频 ASR、虚拟助理 仅固定电话 31个小时 添加引用 德语演讲稿FDB-1000 细微差别 脚本演讲 德国的 德国 低背景噪音(家庭/办公室) 988 1 43000年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词
德国(德国)电话
43.
向下箭头 产品类型ots声音 德国(德国)电话
音频 ASR、虚拟助理 仅固定电话 268小时 添加引用 德国语音DAT(ii)FDB-4000 细微差别 脚本演讲 德国的 德国 低背景噪音(家庭/办公室) 4000年 1 160,000 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
40每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词
德国(德国)电话
61.
向下箭头 产品类型ots声音 德国(卢森堡)电话
音频 ASR、虚拟助理 仅固定电话 33个小时 添加引用 卢森堡德语语音dat (II) FDB-500 (FIXED1LG) 细微差别 脚本演讲 德国的 卢森堡 低背景噪音 500 1 26,500. 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者53个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词
德国(卢森堡)电话
187
向下箭头 产品类型ots-text 德语(瑞士)发音词典
文本 ASR, TTS,语言建模 N / A. 15000个单词 添加引用 deu_CHE_PHON Appen Global. 发音字典 德国的 瑞士 N / A. N / A. N / A. N / A. 15000年 N / A. 文本 德语(瑞士)发音词典
94
向下箭头 产品类型ots声音 德语(瑞士)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 53小时 添加引用 SPEECON德国人(瑞士)数据库 细微差别 脚本演讲 德国的 瑞士 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
德语(瑞士)脚本麦克风
68.
向下箭头 产品类型ots声音 德语(土耳其)电话
音频 ASR、虚拟助理 手机和固定电话 31个小时 添加引用 土耳其语讲德语 细微差别 脚本演讲 德国的 火鸡 低背景噪音 300 1 15600年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者有52个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词
德语(土耳其)电话
188
向下箭头 产品类型ots-text 希腊(希腊)的发音词典
文本 ASR, TTS,语言建模 N / A. 5000个单词 添加引用 ell_grc_phon. Appen Global. 发音字典 希腊语 希腊 N / A. N / A. N / A. N / A. 5000 N / A. 文本 希腊(希腊)的发音词典
117
向下箭头 产品类型ots声音 希腊脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 191小时 添加引用 GRE_ASR001_CN Appen中国 脚本演讲 希腊语 希腊 低背景噪音(家庭/办公室) 287 1 54,113 68271年 16. 数据集包含带有相应文本提示的音频 希腊脚本智能手机
189
向下箭头 产品类型ots-text 瓜拉尼语(巴拉圭)发音词典
文本 ASR, TTS,语言建模 N / A. 35000字 添加引用 grn_PRY_PHON Appen Global. 发音字典 瓜拉尼 巴拉圭 N / A. N / A. N / A. N / A. 35,000. N / A. 文本 瓜拉尼语(巴拉圭)发音词典
190
向下箭头 产品类型ots-text 海地克里奥尔(海地)发音词典
文本 ASR, TTS,语言建模 N / A. 15000个单词 添加引用 hat_HTI_PHON Appen Global. 发音字典 海地克里奥尔 海地 N / A. N / A. N / A. N / A. 15000年 N / A. 文本 海地克里奥尔(海地)发音词典
45.
向下箭头 产品类型ots声音 Hausa(尼日利亚)会话电话
音频 ASR,会话AI,语音分析 手机 33个小时 添加引用 上海ASR002 Appen Global. 会话演讲 豪萨语 尼日利亚 低背景噪音 200. 2 要求可以办到 7,949 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
Hausa(尼日利亚)会话电话
191
向下箭头 产品类型ots-text 豪萨语(尼日利亚)发音词典
文本 ASR, TTS,语言建模 N / A. 11,000字 添加引用 hau_NGA_PHON Appen Global. 发音字典 豪萨语 尼日利亚 N / A. N / A. N / A. N / A. 11,000 N / A. 文本 豪萨语(尼日利亚)发音词典
44.
向下箭头 产品类型ots声音 豪萨语的麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 20小时 添加引用 上海ASR001 全球手机 脚本演讲 豪萨语 喀麦隆 低背景噪音(家庭/办公室) 103 1 7,895 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
豪萨语的麦克风
46.
向下箭头 产品类型ots声音 希伯来语(以色列)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 34小时 添加引用 HEB_ASR001 Appen Global. 会话演讲 希伯来语 以色列 低背景噪音 200. 2 要求可以办到 19250年 8. 法律或wav 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
希伯来语(以色列)会话电话
192
向下箭头 产品类型ots-text 希伯来语(以色列)发音词典
文本 ASR, TTS,语言建模 N / A. 31,000字 添加引用 heb_ISR_PHON Appen Global. 发音字典 希伯来语 以色列 N / A. N / A. N / A. N / A. 31000年 N / A. 文本 希伯来语(以色列)发音词典
48.
向下箭头 产品类型ots声音 印地语(印度)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 32小时 添加引用 HIN_ASR002 Appen Global. 会话演讲 北印度语 印度 混合 996 2 要求可以办到 12,266 8. 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录
印地语(印度)会话电话
193
向下箭头 产品类型ots-text 印地语(印度)的发音词典
文本 ASR, TTS,语言建模 35000字 添加引用 hin_ind_phon. Appen Global. 发音字典 北印度语 印度 N / A. N / A. N / A. N / A. 35,000. N / A. 文本 印地语(印度)的发音词典
47.
向下箭头 产品类型ots声音 印地语(印度)脚本电话
音频 ASR、虚拟助理 手机 224小时 添加引用 HIN_ASR001 Appen Global. 脚本演讲 北印度语 印度 低背景噪音 1,920 1 96,000 9853年 8. 一条法律 完全转录为Speathdat类型约定
数据集伴随着包含所有转录单词的发音词典[SAMPA]
50个扬声器提示,包括数字,自然数,个人,业务和名称,网址,确认项目(是,否+模糊),通用命令和控制项目,语音富裕的句子和单词
印地语(印度)脚本电话
126
向下箭头 产品类型ots-video 人体运动
视频 健身应用,行动分类,手势识别 手机 2000个视频 添加引用 ved_human_body_cn. Appen中国 人体 N / A. 中国 混合背景和照明条件 1000 N / A. N / A. N / A. N / A. mp4 视频剪辑长约10-20秒 人体运动
194
向下箭头 产品类型ots-text 匈牙利语发音词典
文本 ASR, TTS,语言建模 N / A. 500字 添加引用 hun_hun_phon. Appen Global. 发音字典 匈牙利 匈牙利 N / A. N / A. N / A. N / A. 500 N / A. 文本 匈牙利语发音词典
118
向下箭头 产品类型ots声音 匈牙利语(匈牙利)脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 286小时 添加引用 hun_asr001_cn. Appen中国 脚本演讲 匈牙利 匈牙利 低背景噪音(家庭/办公室) 254 1 94031年 201921年 16. 数据集包含带有相应文本提示的音频 匈牙利语(匈牙利)脚本智能手机
49.
向下箭头 产品类型ots声音 匈牙利(匈牙利)脚本电话
音频 ASR、虚拟助理 仅固定电话 65小时 添加引用 匈牙利语演说(e) 细微差别 脚本演讲 匈牙利 匈牙利 低背景噪音 1,000 1 48000年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词
匈牙利(匈牙利)脚本电话
195
向下箭头 产品类型ots-text Igbo(尼日利亚)的发音词典
文本 ASR, TTS,语言建模 N / A. 30000个单词 添加引用 ibo_nga_phon. Appen Global. 发音字典 伊博 尼日利亚 N / A. N / A. N / A. N / A. 30000年 N / A. 文本 Igbo(尼日利亚)的发音词典
149
向下箭头 产品类型ots-text 印度尼西亚语(印度尼西亚)的言语字典的一部分
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 ind_idn_pos. Appen Global. 词法词典 印度尼西亚 印尼 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 印度尼西亚语(印度尼西亚)的言语字典的一部分
148
向下箭头 产品类型ots-text 印度尼西亚(印度尼西亚)的发音词典
文本 ASR, TTS,语言建模 N / A. 95,000字 添加引用 ind_IDN_PHON Appen Global. 发音字典 印度尼西亚 印尼 N / A. N / A. N / A. N / A. 95000年 N / A. 文本 印度尼西亚(印度尼西亚)的发音词典
262
向下箭头 产品类型ots声音 内蒙古(中国)话
音频 ASR,会话AI,语音分析 手机 100小时 添加引用 NMG\ U ASR001\中国 Appen中国 会话演讲 内蒙古 中国 低背景噪音 200. 1 16. 音频;不包括转录
录音内容包括:锡林郭勒盟、通辽、呼和浩特。每个录音环节包含2个人之间约30分钟的自由对话。
内蒙古(中国)话
32.
向下箭头 产品类型ots声音 伊朗波斯(波斯语)(伊朗)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 30小时 添加引用 far_asr002. Appen Global. 会话演讲 伊朗波斯(波斯岛) 伊朗 混合 1,000 2 要求可以办到 12358年 8. 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
伊朗波斯(波斯语)(伊朗)会话电话
31.
向下箭头 产品类型ots声音 伊朗波斯语(波斯语)(伊朗)脚本电话
音频 ASR、虚拟助理 手机和固定电话 85小时 添加引用 far_asr001. Appen Global. 脚本演讲 伊朗波斯(波斯岛) 伊朗 混合 789. 1 38,400 8,716 8. 一条法律 完全被转录为Orientel类型约定
数据集伴随着包含所有转录单词的发音词典[SAMPA]
每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项、语音丰富的句子和单词
伊朗波斯语(波斯语)(伊朗)脚本电话
180
向下箭头 产品类型ots-text 伊朗波斯语(伊朗)辞典部分
文本 ASR, TTS,语言建模 N / A. 1,400,000字 添加引用 pes_IRN_POS Appen Global. 词法词典 伊朗波斯语 伊朗 N / A. N / A. N / A. N / A. 1,400,000. N / A. 文本 伊朗波斯语(伊朗)辞典部分
179
向下箭头 产品类型ots-text 伊朗语发音词典
文本 ASR, TTS,语言建模 N / A. 80000个单词 添加引用 电话号码 Appen Global. 发音字典 伊朗波斯语 伊朗 N / A. N / A. N / A. N / A. 80000年 N / A. 文本 伊朗语发音词典
276
向下箭头 产品类型ots声音 意大利语(意大利)会话智能手机
音频 ASR,会话AI,语音分析 手机 256小时 添加引用 ITA_ASR005. Appen Global. 会话演讲 意大利 意大利 混合(家庭、汽车、公共场所、户外) 482. 1 要求可以办到 要求可以办到 16. 两个人的对话涵盖了广泛的一般性话题,包括服装、文化、教育、金融、食品、健康、历史、酒店、保险、媒体/娱乐、体育、旅游/度假、天气和工作。
每位演讲者参与长达5-15分钟的12次对话。
目前没有发音词典,但可根据要求开发
意大利语(意大利)会话智能手机
52.
向下箭头 产品类型ots声音 意大利语(意大利)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 36个小时 添加引用 ITA_ASR003. Appen Global. 会话演讲 意大利 意大利 低背景噪音 200. 2 要求可以办到 18,974 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
意大利语(意大利)会话电话
197
向下箭头 产品类型ots-text 意大利语(意大利)词典词典
文本 ASR, TTS,语言建模 N / A. 147000个单词 添加引用 ITA_ITA_POS. Appen Global. 词法词典 意大利 意大利 N / A. N / A. N / A. N / A. 147000年 N / A. 文本 意大利语(意大利)词典词典
196
向下箭头 产品类型ots-text 意大利语(意大利)发音字典
文本 ASR, TTS,语言建模 N / A. 197,000个单词 添加引用 伊塔丰 Appen Global. 发音字典 意大利 意大利 N / A. N / A. N / A. N / A. 197,000 N / A. 文本 意大利语(意大利)发音字典
50.
向下箭头 产品类型ots声音 意大利(意大利)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 44小时 添加引用 ITA_ASR001. Appen Global. 脚本演讲 意大利 意大利 混合 200. 4. 40,000 7,316 22. 一条法律 完全转录为Speathdat类型约定
数据集附有包含所有转录词的发音词典
每位发言者200提示,包括100个命令和控制类型项目和100个语音富裕的句子
意大利(意大利)脚本麦克风
53.
向下箭头 产品类型ots声音 意大利(意大利)脚本麦克风
音频 TTS. 麦克风 3小时 添加引用 ITA_TTS001. Appen Global. 脚本演讲 意大利 意大利 低背景噪音(演播室) 1 1 3,300 要求可以办到 22. 一条法律 DataSet伴随着包含数据集中的所有单词的发音词典
3,300个扬声器提示,包括语音富裕的句子
意大利(意大利)脚本麦克风
51.
向下箭头 产品类型ots声音 意大利语(意大利)脚本麦克风in-car
音频 ASR,虚拟助手,汽车HMI和娱乐 麦克风 47小时 添加引用 ITA_ASR002. Appen Global. 脚本演讲 意大利 意大利 混合(车内) 205. 4. 35875年 10366年 48. 一条法律 完全转录为Speathdat类型约定
数据集附有包含所有转录词的发音词典
每个说话人350个提示,包括数字、街道名称、通用命令和控制项、语音丰富的句子和单词
每个扬声器记录1OR 2次会话,包括在停放的车辆中的会话1,其中发动机运行和在60英里/小时的车辆中的课程2(100 km / h)
意大利语(意大利)脚本麦克风in-car
54.
向下箭头 产品类型ots声音 意大利(意大利)电话
音频 ASR、虚拟助理 仅固定电话 38小时 添加引用 意大利固定网络语音语音语音(M)语料库 细微差别 脚本演讲 意大利 意大利 低背景噪音(家庭/办公室) 1,000 1 39000年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每名发言者提供39个提示,包括孤立和连接的数字、自然数字、金钱数量、拼写单词、时间和日期短语、是/否问题、城市名称、常见应用词、短语中的应用词和语音丰富的句子
意大利(意大利)电话
55.
向下箭头 产品类型ots声音 意大利(意大利)电话
音频 ASR、虚拟助理 仅固定电话 228小时 添加引用 意大利语演说(ii)FDB-3000 细微差别 脚本演讲 意大利 意大利 低背景噪音(家庭/办公室) 3,040 1 134,000 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
44个提示,包括数字,自然数字,字母串,个人,地点和业务名称,确认项目(是,否+模糊),通用命令和控制项目和语音丰富的句子和单词
意大利(意大利)电话
56.
向下箭头 产品类型ots声音 意大利(意大利)电话
音频 ASR、虚拟助理 手机 103小时 添加引用 意大利语音(II)MDB-250 细微差别 脚本演讲 意大利 意大利 低背景噪音(家庭/办公室) 375. 1 19,000. 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
51个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词
意大利(意大利)电话
89
向下箭头 产品类型ots声音 意大利(意大利)电话
音频 ASR、虚拟助理 手机 13个小时 添加引用 SpeemDAT(M)意大利移动网络语音数据库 细微差别 脚本演讲 意大利 意大利 低背景噪音(家庭/办公室) 342. 1 13500年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
40每个发言者提示包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目以及语音富裕的句子和单词
意大利(意大利)电话
199
向下箭头 产品类型ots-text 日语(日语)部分词汇词典
文本 ASR, TTS,语言建模 N / A. 265,000字 添加引用 jpn_jpn_pos. Appen Global. 词法词典 日本 日本 N / A. N / A. N / A. N / A. 265000年 N / A. 文本 日语(日语)部分词汇词典
198
向下箭头 产品类型ots-text 日本(日本)发音词典
文本 ASR, TTS,语言建模 N / A. 262000个单词 添加引用 jpn_JPN_PHON Appen Global. 发音字典 日本 日本 N / A. N / A. N / A. N / A. 262,000. N / A. 文本 日本(日本)发音词典
57.
向下箭头 产品类型ots声音 日本(日本)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 33个小时 添加引用 JPN_ASR001 全球手机 脚本演讲 日本 日本 低背景噪音(家庭/办公室) 144 1 13067年 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
日本(日本)脚本麦克风
95
向下箭头 产品类型ots声音 日本(日本)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 57小时 添加引用 Speecon日语 细微差别 脚本演讲 日本 日本 混合(办公室,娱乐,汽车,公共场所) 600人(550名成人和50名儿童) 4. 170000年 要求可以办到 16. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
290每个成人发言者提示和每名儿童发言者的提示包括数字,自然数,字符串,个人,地方和商业名称,成人扬声器的应用程序词,指挥(玩具,电话和一般)为儿童发言者,语音富有的单词和句子对成人发言者的自由和挑剔的自发反应
日本(日本)脚本麦克风
133
向下箭头 产品类型ots-text 日语NER新闻文本
文本 ner,内容分类,搜索引擎 N / A. 20,629句 添加引用 JPY_NER001. Appen Global. 新闻网 日本 日本 N / A. N / A. N / A. 20,629 要求可以办到 N / A. 文本 日语NER新闻文本
200.
向下箭头 产品类型ots-text 爪哇(印度尼西亚)发音字典
文本 ASR, TTS,语言建模 N / A. 20,000个字 添加引用 jav_IDN_PHON Appen Global. 发音字典 爪哇 印尼 N / A. N / A. N / A. N / A. 20,000 N / A. 文本 爪哇(印度尼西亚)发音字典
58.
向下箭头 产品类型ots声音 Kannada(印度)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 15个小时 添加引用 KAN\ U ASR001型 Appen Global. 会话演讲 埃纳德语 印度 混合 178 2 要求可以办到 15660年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
Kannada(印度)会话电话
109
向下箭头 产品类型ots声音 Kannada(印度)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 57小时 添加引用 KAN_ASR001A Appen Global. 会话演讲 埃纳德语 印度 混合 1,000 2 要求可以办到 15660年 8. 一条法律 约。25%的数据集会话是转录和时间戳 - 可以提供完整的成绩单
数据库附带一个包含所有转录单词的发音词典
Kannada(印度)会话电话
201.
向下箭头 产品类型ots-text 卡纳达语(印度)发音词典
文本 ASR, TTS,语言建模 N / A. 49,000字 添加引用 kan_IND_PHON Appen Global. 发音字典 埃纳德语 印度 N / A. N / A. N / A. N / A. 49000年 N / A. 文本 卡纳达语(印度)发音词典
202.
向下箭头 产品类型ots-text 哈萨克语(哈萨克斯坦)发音词典
文本 ASR, TTS,语言建模 N / A. 30000个单词 添加引用 Kaz_kaz_phon. Appen Global. 发音字典 哈萨克 哈萨克斯坦 N / A. N / A. N / A. N / A. 30000年 N / A. 文本 哈萨克语(哈萨克斯坦)发音词典
204.
向下箭头 产品类型ots-text 韩语部分语音词典
文本 ASR, TTS,语言建模 N / A. 10万字 添加引用 kor\u kor\u位置 Appen Global. 词法词典 朝鲜文 韩国 N / A. N / A. N / A. N / A. 100,000 N / A. 文本 韩语部分语音词典
203.
向下箭头 产品类型ots-text 韩国(韩国)的发音词典
文本 ASR, TTS,语言建模 N / A. 10万字 添加引用 Kor_kor_phon. Appen Global. 发音字典 朝鲜文 韩国 N / A. N / A. N / A. N / A. 100,000 N / A. 文本 韩国(韩国)的发音词典
59.
向下箭头 产品类型ots声音 韩语(韩国)脚本话筒
音频 ASR,虚拟助手,Chatbot 麦克风 20小时 添加引用 Kor_Asr001. 全球手机 脚本演讲 朝鲜文 韩国 低背景噪音(家庭/办公室) One hundred. 1 8,107 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
韩语(韩国)脚本话筒
129
向下箭头 产品类型ots-text 韩语NER新闻文本
文本 ner,内容分类,搜索引擎 N / A. 25,830句 添加引用 Kor_ner001. Appen Global. 新闻网 朝鲜文 韩国 N / A. N / A. N / A. 25,830 要求可以办到 N / A. 文本 韩语NER新闻文本
205.
向下箭头 产品类型ots-text 土耳其语发音词典
文本 ASR, TTS,语言建模 N / A. 60,000字 添加引用 kur_tur_phon. Appen Global. 发音字典 Kurmanji. 火鸡 N / A. N / A. N / A. N / A. 60,000 N / A. 文本 土耳其语发音词典
206
向下箭头 产品类型ots-text 老挝语发音词典
文本 ASR, TTS,语言建模 N / A. 9,000字 添加引用 老泳老泳丰 Appen Global. 发音字典 老挝 老挝 N / A. N / A. N / A. N / A. 9000年 N / A. 文本 老挝语发音词典
207
向下箭头 产品类型ots-text 立陶宛语(立陶宛)的发音词典
文本 ASR, TTS,语言建模 N / A. 71000个单词 添加引用 lit_LTU_PHON Appen Global. 发音字典 立陶宛语 立陶宛 N / A. N / A. N / A. N / A. 71000年 N / A. 文本 立陶宛语(立陶宛)的发音词典
208
向下箭头 产品类型ots-text 《马来语(印度)发音词典》
文本 ASR, TTS,语言建模 N / A. 19,000字 添加引用 mal_IND_PHON Appen Global. 发音字典 马拉雅拉姆语 印度 N / A. N / A. N / A. N / A. 19,000. N / A. 文本 《马来语(印度)发音词典》
209
向下箭头 产品类型ots-text 马来西亚发音词典
文本 ASR, TTS,语言建模 N / A. 10,000字 添加引用 msa_MYS_PHON Appen Global. 发音字典 马来西亚 马来西亚 N / A. N / A. N / A. N / A. 10,000 N / A. 文本 马来西亚发音词典
210
向下箭头 产品类型ots-text 普通话(简体)(中国)发音词典
文本 ASR, TTS,语言建模 N / A. 35000字 添加引用 zho_chn_phon. Appen Global. 发音字典 中文(简体) 中国 N / A. N / A. N / A. N / A. 35,000. N / A. 文本 普通话(简体)(中国)发音词典
211
向下箭头 产品类型ots-text 普通话(传统)(台湾)发音词典
文本 ASR, TTS,语言建模 N / A. 50000个单词 添加引用 zho_twn_phon. Appen Global. 发音字典 中文(繁体) 台湾 N / A. N / A. N / A. N / A. 50,000. N / A. 文本 普通话(传统)(台湾)发音词典
63.
向下箭头 产品类型ots声音 普通话(中国)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 26小时 添加引用 MAC_ASR002 全球手机 脚本演讲 普通话中文 中国 低背景噪音(家庭/办公室) 132 1 10,225 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
普通话(中国)脚本麦克风
62.
向下箭头 产品类型ots声音 普通话中文(中国)脚本电话
音频 ASR、虚拟助理 手机和固定电话 323小时 添加引用 MAC_ASR001 Appen Global. 脚本演讲 普通话中文 中国 混合 2,000 1 200000 7145年 8. 一条法律 完全转录为Speathdat类型约定
数据集伴随着包含所有转录单词的发音词典[SAMPA]
98提示每位发言者包括数字,自然数,字符串,个人,地点和商业名称,确认项目(是,否+模糊),通用命令和控制项目(从一组215),语音富裕的句子和单词
普通话中文(中国)脚本电话
131
向下箭头 产品类型ots-text 中文新闻文本
文本 ner,内容分类,搜索引擎 N / A. 17,313句 添加引用 MAC\ U NER001型 Appen Global. 新闻网 普通话中文 中国 N / A. N / A. N / A. 17313年 要求可以办到 N / A. 文本 中文新闻文本
64.
向下箭头 产品类型ots声音 马拉地语(印度)对话电话
音频 ASR,会话AI,语音分析 手机和固定电话 15个小时 添加引用 mar_asr001. Appen Global. 会话演讲 马拉地语 印度 混合 180 2 要求可以办到 11908年 8. 一条法律 大约29%的数据集会话被转录并打上了时间戳——完整的转录本可以被使用
数据集附有包含所有转录词的发音词典
马拉地语(印度)对话电话
110
向下箭头 产品类型ots声音 马拉地语(印度)对话电话
音频 ASR,会话AI,语音分析 手机和固定电话 52小时 添加引用 mar_asr001a. Appen Global. 会话演讲 马拉地语 印度 混合 1,000 2 要求可以办到 11908年 8. 一条法律 部分数据集会话被转录并打上时间戳——完整的转录本可以提供
数据集附有包含所有转录词的发音词典
马拉地语(印度)对话电话
212
向下箭头 产品类型ots-text 马拉地语(印度)发音词典
文本 ASR, TTS,语言建模 N / A. 30000个单词 添加引用 马鲁因德丰 Appen Global. 发音字典 马拉地语 印度 N / A. N / A. N / A. N / A. 30000年 N / A. 文本 马拉地语(印度)发音词典
213
向下箭头 产品类型ots-text 蒙古(蒙古)的发音词典
文本 ASR, TTS,语言建模 N / A. 30000个单词 添加引用 mon_mng_phon. Appen Global. 发音字典 蒙古 N / A. N / A. N / A. N / A. 30000年 N / A. 文本 蒙古(蒙古)的发音词典
215
向下箭头 产品类型ots-text 挪威(挪威)词典的一部分
文本 ASR, TTS,语言建模 N / A. 3000个单词 添加引用 nor_NOR_POS Appen Global. 词法词典 挪威 挪威 N / A. N / A. N / A. N / A. 3,000 N / A. 文本 挪威(挪威)词典的一部分
214
向下箭头 产品类型ots-text 挪威(挪威)发音词典
文本 ASR, TTS,语言建模 N / A. 115000个单词 添加引用 诺乌诺乌丰 Appen Global. 发音字典 挪威 挪威 N / A. N / A. N / A. N / A. 115,000. N / A. 文本 挪威(挪威)发音词典
264
向下箭头 产品类型OTS-Image 对象图像集合
图像 图像标签识别培训 手机和相机 2196张图片 添加引用 img_tag_cn. Appen中国 对象的形象 N / A. N / A. 混合照明条件 N / A. N / A. N / A. jpg. 多场景图片样本库共2196张图片,分类如下:KTV:50,百货公司:55,办公室:100;博物馆:63个;电器:55台;海军:191人;汽车:50辆;手提包:35个;夜景:54;运动器材:54件;便利店:34家;餐厅:54家;窗景:62;宠物:82只;船舶:50艘;动物园,70岁;服装店:53家;海滩:95;机场:65张机票;健身房:47;景点:77个;人群:67人;沙漠:73;海滩:68;山区:54;购物中心:55家;树木:85;天空:102;雪:71;雪山:53;夜景:78;操场:94 对象图像集合
216
向下箭头 产品类型ots-text oriya(印度)的发音词典
文本 ASR, TTS,语言建模 N / A. 15000个单词 添加引用 ori_ind_phon. Appen Global. 发音字典 oriya. 印度 N / A. N / A. N / A. N / A. 15000年 N / A. 文本 oriya(印度)的发音词典
80
向下箭头 产品类型ots声音 旁遮普(巴基斯坦)对话电话
音频 ASR,会话AI,语音分析 手机和固定电话 20小时 添加引用 PAP_ASR001 Appen Global. 会话演讲 Panjabi. 巴基斯坦 低背景噪音 205. 2 要求可以办到 7298年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
71%的呼叫,两个扬声器(在线/单线)都收集并转录,但是,对于29%的电话,只收集了一半的谈话,并转录
旁遮普(巴基斯坦)对话电话
74
向下箭头 产品类型ots声音 Pashto(阿富汗)播出
音频 ASR,自动标题,关键字斑点 麦克风 51小时 添加引用 PAS_BRC001. Appen Global. 广播演讲 北普什 - 南普什岛 阿富汗 低背景噪音(演播室) N / A. 1 要求可以办到 要求可以办到 N / A. 数据集已完全转录和时间戳
目前没有发音词典,但可根据要求开发
数据集主要是语音,不包括音乐和广告
数据类型包括:谈话节目,访谈,新闻广播(不包括锚的新闻读数)
Pashto(阿富汗)播出
73
向下箭头 产品类型ots声音 普什图语(阿富汗)会话话筒
音频 ASR,会话AI,语音分析 麦克风 39小时 添加引用 PAS_ASR002 Appen Global. 会话演讲 北普什 - 南普什岛 阿富汗 低背景噪音 40 2 34860 9480年 16. 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
此外,你还可以购买成绩单的法文译本
平均呼叫长度:120分钟,一个发言者作为面试官,另一个人作为访受方案的另一个人类似于Transtac风格(例如民事,检查站等)
面试官出现在多种对话中,但受访者对每套都是独一无二的
普什图语(阿富汗)会话话筒
72
向下箭头 产品类型ots声音 Pashto(阿富汗)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 55个小时 添加引用 PAS_ASR001 Appen Global. 会话演讲 北普什 - 南普什岛 阿富汗 低背景噪音 967 2 要求可以办到 13,633 8. 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
对于大多数呼叫来说,都收集并转录了两个扬声器(在线/超出线),但是,对于较少数量的呼叫,只收集一半的谈话被收集并转录
Pashto(阿富汗)会话电话
217
向下箭头 产品类型ots-text 帕什托(阿富汗)发音词典
文本 ASR, TTS,语言建模 N / A. 65000个单词 添加引用 pus_afg_phon. Appen Global. 发音字典 粉碎 阿富汗 N / A. N / A. N / A. N / A. 65000年 N / A. 文本 帕什托(阿富汗)发音词典
219
向下箭头 产品类型ots-text 波兰语(波兰)词语字典的一部分
文本 ASR, TTS,语言建模 N / A. 4000个单词 添加引用 pol_pol_pos. Appen Global. 词法词典 波兰的 波兰 N / A. N / A. N / A. N / A. 4000年 N / A. 文本 波兰语(波兰)词语字典的一部分
218
向下箭头 产品类型ots-text 波兰语(波兰)的发音词典
文本 ASR, TTS,语言建模 N / A. 40,000字 添加引用 pol_POL_PHON Appen Global. 发音字典 波兰的 波兰 N / A. N / A. N / A. N / A. 40,000 N / A. 文本 波兰语(波兰)的发音词典
75
向下箭头 产品类型ots声音 波兰语(波兰)脚本麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 25小时 添加引用 pol_asr001. 全球手机 脚本演讲 波兰的 波兰 低背景噪音(家庭/办公室) 99 1 10,130. 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
波兰语(波兰)脚本麦克风
119
向下箭头 产品类型ots声音 波兰语(波兰)脚本智能手机
音频 ASR,虚拟助手,Chatbot 手机 293小时 添加引用 POL_ASR002_CN Appen中国 脚本演讲 波兰的 波兰 低背景噪音(家庭/办公室) 353. 1 106,674 168,544 16. 数据集包含带有相应文本提示的音频 波兰语(波兰)脚本智能手机
76
向下箭头 产品类型ots声音 波兰语(波兰)脚本电话
音频 ASR、虚拟助理 仅固定电话 78小时 添加引用 波兰语音DAT(e)数据库 细微差别 脚本演讲 波兰的 波兰 低背景噪音 1,000 1 48000年 要求可以办到 8. 要求可以办到 数据集完全转录为speech hdat类型约定,并伴随着发音词典和验证报告
每个发言者有48个提示,包括数字、自然数字、字母串、个人、地点和业务名称、确认项(是、否+模糊)、通用命令和控制项以及语音丰富的句子和单词
波兰语(波兰)脚本电话
78
向下箭头 产品类型ots声音 葡萄牙语(巴西)会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 33个小时 添加引用 PTB\单元ASR002 Appen Global. 会话演讲 葡萄牙语 巴西 低背景噪音 200. 2 要求可以办到 11,287 8. 一条法律 数据集是完全转录和时间戳
数据集附有包含所有转录词的发音词典
63%是固定电话,38%是手机
葡萄牙语(巴西)会话电话
77
向下箭头 产品类型ots声音 葡萄牙语(巴西)麦克风
音频 ASR,虚拟助手,Chatbot 麦克风 26小时 添加引用 PTB\单元ASR001 全球手机 脚本演讲 葡萄牙语 巴西 低背景噪音(家庭/办公室) 102 1 10,417 要求可以办到 16. 数据集已完全转录,转录在原始脚本和罗马化表单中都可以使用
每个扬声器都读取了从Web Tocover可用的国家报纸文章中选择的句子的许多致盲句子,这是一个大词汇的宽域
与卡尔斯鲁厄理工学院(KIT)合作开发
葡萄牙语(巴西)麦克风
221
向下箭头 产品类型ots-text 葡萄牙语(巴西)词典的一部分
文本 ASR, TTS,语言建模 N / A. 98,000个单词 添加引用 por_bra_pos. Appen Global. 词法词典 葡萄牙语 巴西 N / A. N / A. N / A. N / A. 98000 N / A. 文本 葡萄牙语(巴西)词典的一部分
220
向下箭头 产品类型ots-text 葡萄牙语(巴西)发音词典
文本 ASR, TTS,语言建模 N / A. 102,000字 添加引用 波鲁布拉丰 Appen Global. 发音字典 葡萄牙语 巴西 N / A. N / A. N / A. N / A. 102000年 N / A. 文本 葡萄牙语(巴西)发音词典
79
向下箭头 产品类型ots声音 葡萄牙语会话电话
音频 ASR,会话AI,语音分析 手机和固定电话 36个小时 添加引用 ptp_asr001. Appen Global. 会话演讲 葡萄牙语 葡萄牙 低背景噪音 200. 2 要求可以办到 16339年 8. 一条法律 数据集已完全转录和时间戳
数据集附有包含所有转录词的发音词典
该项目记录了200个电话对话 - 100名扬声器每次调用2(从固定电话,从机组人1中的1个)到100个呼叫接收器的池
葡萄牙语会话电话
223
向下箭头 产品类型ots-text 葡萄牙语(葡萄牙)词典的一部分
文本 ASR, TTS,语言建模 N / A. 60,000字 添加引用 por_PRT_POS Appen Global. 词法词典 葡萄牙语 葡萄牙 N / A. N / A. N / A. N / A. 60,000 N / A. 文本 葡萄牙语(葡萄牙)词典的一部分
222