3月14日,清华大学高性能计算研究所翟季冬教授团队与清华系科创企业“清程极智”联合宣布,开源大模型推理引擎“赤兔Chitu”。据介绍,该引擎首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型。