华为重磅发布网络AI领域10大公开数据集
本篇文章1520字,读完约4分钟
2020年3月20日,在华为开发者大会现场直播室。云3月20日,华为网络人工智能数据湖专家周瑶向开发商正式发布了网络人工智能领域的10套公共数据集,解决了网络人工智能发展中工业数据缺乏的问题。
这10个数据集是华为的数据集,通过对现场模拟数据和实验室模拟数据的分析、管理、探索和标注,可以直接应用于网络领域的人工智能应用开发。它可以分为三类:“异常检测类”、“控制优化类”和“故障定界类”:
■异常检测类别
1)性能指标异常检测数据集:时间序列数据集,包括正样本和负样本,可应用于时间序列预测等算法的训练和验证;样本大小为100瓦,特征尺寸为7维
2)绩效指标变化监控与测量数据集:覆盖四种网络业务变化场景,包括变化成功场景和变化失败场景,失败场景数据有相应的标签;样本大小为100瓦,特征尺寸为40维
3)硬盘故障检测数据集:涵盖日立和希捷的16种硬盘型号,标记坏盘累计超过2300个,用于硬盘故障预测问题的分析研究;样本大小超过230瓦,特征尺寸超过100个尺寸(涵盖制造商披露的智能指示器)
■控制优化类
4)数据中心群控数据集:包括冷塔、冷机、泵等设备的供回水温度和压力,以及100+维度的it机房和冷站设备的能耗,可应用于数据中心水冷冷水机组场景中制冷系统的优化模型训练;样本大小为2w,特征尺寸为100个尺寸
5)数据中心pue优化数据集:涵盖三种降温方案、四终端空空调、冷站群控、it机房等设备能耗数据。基于冷却系统完成关联,并应用于pue优化、网络域控制模型的开发和研究;样本大小为2w,特征尺寸为110个尺寸
■断层划分等级
6)无线接入故障数据集:涵盖20种无线接入故障,告警数据与工单数据相关,由业务专家团队准确标注。它可用于警报压缩和根本原因定位模型开发,样本大小为65w,特征尺寸为7维
7)无线ipran故障数据集:报警数据基于无线接入和ipran的设备拓扑关联。工单数据用于标记根本原因警报,涵盖37种故障类型,可用于警报压缩和故障定位。样本大小为700瓦+且特征尺寸为24个尺寸
8)无线ptn故障数据集:根据无线基站的拓扑结构、电源环境、ptn和其他设备关联报警数据。工单数据用于标记根本原因警报,涵盖48种故障类型,可用于警报压缩和故障定位。样本大小为100瓦以上,特征尺寸为61个尺寸
9)无线微波故障数据集:报警数据是根据无线基站的拓扑结构、电源环境、微波等设备关联的。工单数据用于标记根本原因警报,涵盖29种故障类型,可用于警报压缩和故障定位。样本大小为100瓦以上,特征尺寸为46个尺寸
10) pon光路故障数据集:pon光路故障场景数据,包括光纤弯曲、连接器松动等故障场景,涵盖光模块的特性,如电压、电流、接收光功率、发射光功率等。样本大小为4w,特征尺寸为11个尺寸
数据和特征决定了机器学习的上限。华为在网络领域发布了10个数据集,这不仅可以帮助网络人工智能开发者减少90%的数据集准备时间,还可以大大提高人工智能模型的准确性。目前已经证实,数据中心数据集可以帮助人工智能模型达到89.77%的准确率,无线ipran故障数据集可以将高级聚合率提高到95.4%,准确率提高到90%。
现在使用华为云帐户登录华为云,选择naie服务(路径:ei企业智能-代理-网络代理naie),然后从ai服务目录中选择数据集服务,然后进入数据集服务页面,选择所需的公共数据集(www.hwtelcloud/products/dsi)。
华为网络人工智能论坛将于2020年3月至4月在华为开发者大会现场直播。欢迎您关注公共号码[网络人工智能花园]并点击菜单[hdc]进入我们的现场直播和在线专家讨论交流!
标题:华为重磅发布网络AI领域10大公开数据集
地址:http://www.qdgzw.com/kjcy/33093.html
免责声明:京青年创业网是一个专业为创业者提供学习交流的创业资讯媒体,更新的资讯来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,京青年创业网编辑将予以删除。