第108章 晶片

    沈一鸣入职的第三天,张磊把一份晶片调研报告甩在了左城桌上。
    “城哥,调研报告出来了,情况不太乐观。“张磊拉了把椅子坐下来,“国產ai晶片主要就两家能看,寒武纪和地平线。寒武纪的mlu270算力不错,峰值算力达到128 tops,但功耗偏高,十五瓦往上走。地平线的旭日3功耗控制得好,只有两瓦,但算力只有5 tops,跑不了大模型。“
    左城翻著报告,眉头越皱越紧。
    “进口的呢?“
    “英伟达的jetson nano,算力和功耗都比较均衡,但一颗晶片的採购价是国產的三倍。而且现在贸易摩擦升级,供应链不稳定,万一哪天被卡脖子就麻烦了。“张磊敲了敲桌面,“城哥,我的建议是短期用国產,长期想办法自研。“
    “自研?“左城抬起头,“我们做ai晶片,你有把握?“
    “不是现在做。“张磊说,“方泽和我討论过,ai晶片的核心是架构设计,不是製造。设计我们可以做,流片代工就行。关键是架构,这东西需要算法和硬体深度耦合,我们正好有算法团队和硬体团队。“
    左城沉默了一会儿。自研ai晶片是一条漫长而烧钱的路,但如果不做,402的ai业务就永远受制於晶片供应商。
    “先把短期的方案定下来。“左城说,“边缘ai推理场景用寒武纪的mlu270,功耗虽然高一点但算力够用。联邦学习场景用地平线的旭日3,功耗低適合大规模部署。高端训练场景先用英伟达,同时和寒武纪谈定製方案。“
    “行,我去跟进採购。对了,寒武纪那边说可以提供一批工程样片先让我们测试,不收费。“张磊站起来,又想起什么,“方泽说寒武纪那边有个人想见你。他们正在找垂直场景的合作伙伴做晶片验证,听说我们物联网平台上跑著ai,很感兴趣。“
    “约个时间。“左城说。
    张磊走后,左城打开系统面板,翻到ai枝干的叶片列表。
    模型压缩优化。这枚叶片的能力是將ai模型在保持精度的前提下大幅压缩体积,让大模型可以跑在资源受限的边缘设备上。如果模型压缩做到极致,寒武纪的mlu270就能跑本该需要英伟达高端晶片才能跑的模型,功耗还能降下来。
    左城想到这里,叫来了沈一鸣。
    “一鸣,你之前在论文里提到的自適应压缩率,和系统面板里这枚模型压缩优化的思路能不能结合?“
    沈一鸣刚入职三天,还在熟悉402的技术栈,听到左城的问题愣了一下:“模型压缩优化?你是指通用的模型压缩技术?“
    左城意识到自己差点说漏嘴,赶紧改口:“我的意思是,你的自適应压缩率算法,和业界主流的模型压缩技术能不能做更深度的结合?比如知识蒸馏加量化加你的自適应压缩,三管齐下。“
    沈一鸣思考了一会儿,推了推眼镜,眼睛亮了:“理论上可以。知识蒸馏把大模型的知识转移到小模型,量化降低精度要求,自適应压缩动態调整通信和计算量。三条路径叠加,压缩比可能做到五十倍以上。但如果三条路径深度耦合,还能更进一步,因为量化和蒸馏的损失可以在自適应压缩中被补偿。“
    “五十倍?“左城的心跳加速了。
    “保守估计。“沈一鸣拿过左城桌上的白板笔,在旁边的小白板上画了一个流程图,“你看,传统的做法是三步串行,蒸馏完了再量化,量化完了再压缩,每一步的误差会累积。但如果把三步並行,让蒸馏的损失函数包含量化约束,量化的参数空间由自適应压缩来搜索,误差就不会累积,反而可以互相补偿。“
    他在白板上写了几个公式,虽然写得很潦草,但逻辑清晰。
    “不过这需要三个方向的代码深度耦合,工程量不小。“沈一鸣放下笔,“至少要三个人做三个月。“
    “你来做。“左城说,“需要什么资源我给你配。算法方面你和马昊配合,工程方面方泽的硬体团队做支撑。两周內给我一个技术方案。“
    沈一鸣深吸一口气:“两周有点紧,但可以试试。“
    左城拍了拍他的肩膀:“不是试试,是做到。“
    沈一鸣愣了一下,然后用力点了点头。
    当天下午,左城在系统面板上查看了科技树的被动效果。ai枝干激活后,所有融合叶片的技术增幅从1.2倍提升到了1.25倍。也就是说,沈一鸣的模型压缩方案在402落地时,实际效率会比理论上更高。
    但他不能告诉沈一鸣这一点。
    左城关掉系统面板,拿起手机拨了於颖的电话。
    “空空,今晚有空吗?“
    “有啊,怎么了?“
    “想请你看场好戏。“左城笑了笑,“寒武纪的人明天来公司谈合作,你要不要过来旁听?他们对边缘ai联邦学习很感兴趣,你的研究方向正好对口。“
    於颖在电话那头沉默了两秒钟:“你是想让我当技术顾问吧?“
    “主要还是想你。当顾问是附带的。“
    “哼。“於颖笑了,“行吧,几点?“
    “上午十点,我让韩露给你发定位。“
    掛了电话,左城靠在椅背上,看著窗外。天色渐暗,科技园区的路灯陆续亮了起来。402的办公室灯火通明,沈一鸣在工位上埋头写方案,方泽在实验室里测试晶片功耗,陈浩在伺服器机房调试算力分配。
    402的ai晶片之路,从选择供应商开始,一步一步走。但左城心里清楚,这只是第一步。真正的牌是模型压缩优化加联邦学习,一旦这两项技术结合到位,402就能用国產中端晶片跑出高端晶片的性能。到那时候,晶片就不再是瓶颈,而是402的成本优势。
    那才是真正的护城河。
本站所有小说均来源于会员自主上传,如侵犯你的权益请联系我们,我们会尽快删除。

腐文书,免费小说,免费全本小说,好看的小说,热门小说,小说阅读网
版权所有 https://www.fuwenshu1.com All Rights Reserved, 联系邮箱:ad#taorouwen.com