上海交通大学鲲鹏昇腾科教创新卓越中心特训营DeepSeek专场圆满举办

  • 时间:
  • 浏览:0
  • 来源:友友文章网

  3月26日昨天 ,从上海交通学校学生学校学生学生鲲鹏昇腾科教创新卓越两个中心特训营-DeepSeek专场在从上海交通学校学生学校学生学生闵行校区图书相关信息楼成功了参加比赛。活动时旨在基于昇腾相关技术的DeepSeek本地化部署实践分享 ,培养学员自主创新开发能力方面。华为相关技术专家与学校学生学校学生学校学生学生董老师现场准备授课  ,干货满满  ,引吸了腾讯体育计算机、电子相关信息、人工智能等选择专业的60余名学校学生学校学生学生参加比赛。

  相关技术筑基:解析 DeepSeek 大模型核心架构

  活动时一年以来  ,昇腾生态相关技术专家 ZOMI酱 ,分享了基于昇腾Atlas 800 A2部署满血DeepSeek-R1-671B的宝贵经验  ,重点分享了怎么实施剪枝和量化  ,让DeepSeek-R1/V3大模型特性能实现加速。他指出 ,昇腾Atlas 800 A2的硬件特性与DeepSeek模型真实高度适配。实施结构化剪枝相关技术 ,基于昇腾芯片的稀疏计算单元(如CANN的aclSparse接口)  ,对模型中冗余的切记力头与FFN层通道实施动态裁剪  ,在完全保证 工作任务精度损失小于1%的前提下  ,将参数量压缩40%  ,推理时延大幅降低。具体包括 ,设计方式方式混合量化策略——对计算密集的矩阵乘具体包括 操作(如Q/K/V投影)启用INT8动态量化  ,融合昇腾3D Cube架构的整数计算加速 ,能实现算力借助率提高200%;而对精度敏感的LayerNorm等具体包括 操作保留FP16精度  ,规避 量化误差扩散。具体包括  ,他还简要介绍 了昇腾Attention计算优化两种方法Laser Attention  ,该相关技术实施动态稀疏计算、低精度无损加速与硬件级算子融合三重创新 ,为大模型训练与推理提供全面显著效能提高。

  (昇腾生态相关技术专家 ZOMI酱)

  实践落地:揭秘 DeepSeek 高校部署创新方案

  大模型凭借出色的文本其他处理 能力方面 ,还没有深入工作会就是生活的方多个方面面 ,被广泛应用于文案写作、文本其他处理 、数据统计 数据分析等。怎么在本地部署是个专应该别人是大模型?不知道道怎么跟大模型对话才能才能真正发挥其出色的其功能?许多都会初窥门径的AI开发者关心的核心解决目前。从上海交大图片相关信息两个中心“交我算”强强大团队工程师王星泽围绕在交大本地的昇腾产品服务器上部署DeepSeekV3/R1大模型的宝贵经验 简要介绍 部署两种方法  ,具体包括硬件设备全部条件、图片拓扑、API封装、前端集成等。具体包括  ,还融合大模型在高校科研、教学和管理当中实际应用场景  ,简要介绍 提示词技巧和实施案例。

  (从上海交通学校学生学校学生学生图片相关信息两个中心计算专员 王星泽)

  开发实战:体验感原生开发全流程

  培训中  ,昇思布道师都很work董老师的基于香橙派AI pro(20T)开发板的开发实战引吸了现场准备每一一位女性性交学校学生学校学生学生子  ,对MindSpore在香橙派开发板上把能力方面需要支持要做详细的表明  ,我们迫不及待动手体验感。目前为止昇思MindSpore AI框架已实还没有香橙派AIpro开发板预置  ,并在官方媒体网站上线开发指导教程 ,实施软硬融合  ,使能开箱即用模型  ,并提供全面模型全流程使能套件  ,需要支持积木式搭建  ,覆盖CV、NLP小模型及1B级大模型(如DeepSeek-R1-Distill-Qwen-1.5B)。学校学生学校学生学校学生学生可实施动态图+类HuggingFace接口灵活调试  ,融合三行代码调用JIT即时编译  ,兼顾开发效率与执行性能  ,为边缘端AI部署提供全面轻量化核心解决目前方案。

  (昇思布道师都很work)

  本次特训营是基于从上海交通学校学生学校学生学生鲲鹏昇腾科教创新卓越两个中心实施的2025年第二场DeepSeek主题特训营。该两个中心自2024年6月揭牌正式正式组建一年以来  ,始终致力于构建基于鲲鹏昇腾相关技术路线的校级生态深度合作大平台 ,围绕学校学生学校学生学生计算产业前沿课题研究中、课程体系建成、研究中人才培养等多个方面实施深度合作 ,为产业输出高质量鲲鹏昇腾原生人才  ,孵化和培育根植说的世界是大世界级原生科研创新成果。

  据悉 ,鲲鹏昇腾科教创新卓越两个中心特训营将不断 推进  ,日渐特训营在全国各地重点高校的陆续实施  ,校企协同育人的创新操作模式正为国产化AI人才培养注入新动能。