3月20日,华为云中小企业AI解决方案发布会上推出了柔性智算操作系统FlexNPU,旨在通过构筑强大而灵活的AI Infra层算力调度技术,提升推理池的有效算力利用率,从而以相同AI硬件算力投入,提供更大的Token吞吐输出。 华为云首席架构师、华为公司Fellow顾炯炯表示,FlexNPU赋予NPU/GPU算力“柔性或液态化”供给与伸缩的能力,可依据任意业务需求动态变化随需而动,如同金箍棒一般“可大可小、变化随心”,通过最大化AI算力投入的利用率,最终实现Token性价比的最优化。
⚠️ 声明:本站数据来自AI数据整合,不做任何投资参考依据,如何侵犯了您的版权权益,请联系我们立即删除!