在万物皆算的时代,各领域应用层出不穷,算力必须支撑实际应用,通用性和未来可扩展性是评估算力的重要指标。天数智芯作为国内头部通用GPU高端芯片及超级算力系统提供商,截止2023年6月,已成功支持200+ AI算法模型,覆盖训练和推理,与400+家客户和生态伙伴建立合作,共同促进国内通用算力的发展,产品服务于智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
天数智芯本着“平台共建、生态共享、产业共赢”的原则,致力于和行业伙伴一起打造DeepSpark开源社区,以来自开源回馈开源的方式,汇聚社区力量,助力客户加速应用落地和收获算力赋能,促进产业生态的完善和发展。
DeepSpark开源社区目前主要致力于百大应用开放平台的打造和推广。除此之外DeepSpark社区于2023年3月开源上线了适用于国产通用GPU天垓100的CUDA应用程序调试工具ixGDB。将来会有更多相关的项目和成果通过DeepSpark社区开源。
2023年8月,DeepSpark开源社区与上海白玉兰开源开放研究院签署了战略合作协议,旨在进一步促进人工智能开源事业共建共享,推动产业生态的完善和发展。
欢迎行业合作伙伴、社区用户和开发者以任何形式为DeepSpark开源社区作贡献,期待您的积极参与。
百大应用开放平台作为国内领先的AI和通用计算应用开发及评测平台,甄选上百个与行业应用深度耦合的开源算法和模型,支持主流生态应用框架,并针对行业需求构建多维度评测体系,广泛支持各类落地场景。
百大应用开放平台甄选上百个应用算法和模型,覆盖AI和通用计算各领域,支持主流市场智能计算场景,包括智慧城市、数字个人、医疗、教育、通信、能源等多个领域。
百大应用开放平台支持国内外主流应用框架和工具箱。
评测标准广泛适用于硬件平台,体系完备,部署简单。
- 提供 6️⃣ 维度
维度 | 说明 | 数据来源 | 计算方法 |
---|---|---|---|
速度 🚀 |
模型稳定训练时每秒处理的单位样本的算力 | DeepSpark模型训练脚本输出 | 指定迭代轮次5次去掉最高最低,取中间3次的mean中值 |
准确性 🎯 |
模型收敛的精度值 | DeepSpark模型训练脚本输出 | 记录模型收敛时的精度值 |
线性度 📈 |
模型集群规模化训练算力的线性扩展性能 包括卡线性度和节点线性度 |
DeepSpark模型训练脚本输出 | 用多卡/多节点的训练速度除以卡数/节点数,再对比使用单张/单节点的训练速度 |
功耗 🔌 |
模型稳定训练时候实际消耗的GPU平均功耗 | GPU实时状态检测工具 | 取多次的功耗数据的平均值 |
显存占用 📊 |
模型稳定训练时实际消耗的GPU平均显存占用量 | GPU实时状态检测工具 | 取多次的显存占用量的平均值 |
稳定度 🔧 |
多次完整训练(均达到收敛值)的收敛值的稳定程度 | DeepSpark模型训练脚本输出 | 采用5次达到标准收敛值的完整训练,取收敛值的中值做为基准值,其它值对比基准值的差值百分比有1次不在(-0.01,+0.01)范围内,稳定度则递减20% |
参考信息:硬件评测结果
-
支持 1️⃣ 键式部署
全自动 ✅ 、数据可复现 🔁 、场景可寻源 🔎
-
0️⃣ 平台依赖
不限制框架、不限制源语、不限制硬件
评测方法详见 天垓100六维度评测方法。
评测结果如下:
任务 | 模型 | 收敛指标 | 配置(x->gpus) | 速度 | 准确度 | 功耗(W) | 线性度 | 显存占用(G) | 稳定度 |
---|---|---|---|---|---|---|---|---|---|
自然语言处理 | BERT-large | 0.72 | sdk2.2,bs:32,8x,amp | 214 | 0.72 | 152*8 | 0.96 | 20.3*8 | 1 |
推荐系统 | DLRM | AUC:0.75 | sdk2.2,bs:2048,8x,amp | 793486 | 0.75 | 60*8 | 0.97 | 3.7*8 | 1 |
图像分类 | ResNet50 | top1 75.9% | sdk2.2,bs:512,8x,amp | 5221 | 76.43% | 128*8 | 0.97 | 29.1*8 | 1 |
图像分割 | 3D U-Net | 0.908 | sdk2.2,bs:4,8x,fp32 | 12 | 0.908 | 152*8 | 0.85 | 19.6*8 | 1 |
目标检测 | YOLOv5 | mAP:0.5 | sdk2.2,bs:128,8x,amp | 1228 | 0.56 | 140*8 | 0.92 | 27.3*8 | 1 |
文本检测 | SATRN | 0.841 | sdk2.2,bs:128,8x,fp32 | 630 | 88.4 | 166*8 | 0.98 | 28.5*8 | 1 |
语音识别 | Conformer | 3.72 | sdk2.2,bs:32,8x,fp32 | 380 | 4.79 | 113*8 | 0.82 | 21.5*8 | 1 |
3D重建 | ngp-nerf | 0.0046 | sdk2.2,bs:1,8x,amp | 10 | 19.6 | 82*8 | 0.90 | 28.1*8 | 1 |
目标追踪 | FairMOT | MOTA:69.8 | sdk2.2,bs:64,8x,fp32 | 52 | 69.8 | 132*8 | 0.97 | 19.1*8 | 1 |
大模型 | CPM | 0.91 | sdk2.2,bs:128,8x,amp | 357 | 0.91 | 156*8 | 0.93 | 20.6*8 | 1 |
语音语义 | Tacotron2 | score(MOS):4.460 | sdk2.2,bs:128,8x,amp | 77 | 4.46 | 128*8 | 0.96 | 18.4*8 | 1 |
新兴模型 | Wave-MLP | 80.1 | sdk2.2,bs:256,8x,fp32 | 1026 | 83.1 | 198*8 | 0.98 | 29.4*8 | 1 |
各维度说明,请见评测体系。
请参见 Code of Conduct。
请联系 [email protected]。
请参见各项目的Contributing Guidelines。