
每经记者:可杨 每经编辑:魏官红
今年春节期间,林咏华阅读了马斯克的自传,书中写到猎鹰一号到三号历经多次失败,马斯克带领团队在粗陋的环境中进行试验,直到第四次发射成功,这也勾起了她的回忆。
林咏华是IBM中国研究院的首位女性院长,如今供职于北京智源人工智能研究院,任副院长兼总工程师。早年间,她与团队在戈壁滩的恶劣环境中和海峡渡轮甲板上的热浪中进行实验,最终验证了系统和技术的可用性,这些经历至今仍影响着她。
“所有的科研第一要十分注重细节,第二不能在象牙塔里做科研,甚至连仿真环境都未必可以,一定要上‘战场’。”在接受《每日经济新闻·赛博NBD》专访时,林咏华表示。
从探索IT(信息技术)与通信的交叉创新,到提出“AI for AI”,再到如今打造统一开源的技术栈,试图扭转产业对单一封闭生态的依赖——打破技术边界,已经成为林咏华职业生涯的注脚,她是一位技术革新者,致力于改变桎梏行业发展的底层逻辑。
从无线通讯到AI
林咏华总是站在技术的前沿。
在IBM的前期,她最初的研究方向是IT和通信领域的跨界创新。在她加入IBM的第8年,人工智能产业升温,热潮翻涌,也成为她迈入人工智能产业的契机。
“人机对决”是人工智能技术跃升的关键节点之一,人类与机器交锋的瞬间,人工智能的边界被重新定义,激发了向前一步的决心。
2011年,IBM的电脑系统Watson(沃森)在美国电视智力竞赛节目《Jeopardy!》(即《危险边缘》)中战胜了两位人类冠军。Watson的成功,促使IBM将公司战略全面转向AI(人工智能),这样的转变不仅发生在IBM,而是发生在全世界。
2009年,李飞飞团队提出ImageNet,她认为如果AI要像人类一样理解世界就需要海量的数据,次年,李飞飞发起了ImageNet大型视觉识别挑战赛(ILSVRC),“深度学习革命”缓慢拉开帷幕。
IBM的主动转型与深度学习的热潮,让林咏华开始思考,自己的经验如何才能为人工智能提供新的视角。
“我当时做的是无线通讯和信号处理,通信信号的编解码运算复杂度并不比深度学习少。”在通信领域,信号的编解码运算极其复杂,林咏华做过一个计算:每发送一个比特的数据,所需的计算量要高于CNN网络(卷积神经网络)。
这意味着,通信技术专家在计算优化方面的某些经验积累可以迁移到AI领域。当时,通信系统早已大量使用FPGA(现场可编程门阵列)等加速板卡,来协同优化效率并支持云端部署,这种算法与硬件协同优化的思维方式,同样适用于AI领域。
“迁移学习的出现和今天的大模型有异曲同工之妙。”林咏华解释道,迁移学习是指先训练一个通用的基础模型(Backbone),然后通过大量其他领域的用户数据微调学习,使基础模型能够适应不同应用场景。例如,先训练一个计算机视觉模型,再利用医疗数据对其微调,以识别医疗影像中的病变。
迁移学习的出现,让林咏华开始思考,能否让AI模型训练彻底自动化?
林咏华的设想是,发挥团队在系统领域的优势,让用户只需要上传数据,系统会自动选择合适的基础模型(Backbone),并匹配最优的迁移学习算法,启动训练。训练完成后,用户可以直接在云端部署模型,甚至一键自动生成FPGA、GPU(图形处理器)等不同硬件的核心代码,实现完全自动化部署。
“这不仅符合IBM的AI战略转型方向,也最大化了我们团队在算法和硬件协同优化方面的积累。”林咏华回忆道,“AI for AI”这一概念,最终成功落地,被IBM实现产品化,并在全球推广。
寻找AI落地的最优解
AI的落地还是太慢了。
从技术到产品落地,是林咏华从二十年前开始思考的课题。
“无论是以前的无线通信中的信号处理还是今天的AI,每年可能不到1%的文章里的算法有机会真正用到产业界、工业界,如果这两条线一直割裂,是不会对产业有推动的。”林咏华表示。
2019年底,林咏华离开IBM。“在IBM研究院,我看到很多好的AI技术的产品化需要解决方案团队等部门的配合才能落地市场,周期很长。”从一项好的技术变成一个好的产品,仍有层层壁垒,她感到这是在“隔靴搔痒”。
离开IBM后,林咏华曾经短暂地投身产业,选择“AI for 农业”,但是产业界的情况同样复杂,“我发现,很多AI技术只能解决一部分问题,仍有很多问题需要进一步的研究才能解决”。
在工业环境中,AI面对的是高度标准化的生产流程,可以依靠小模型完成特定任务。但农业不是标准化生产流程,面临更多复杂场景,在这里,机械臂跟不上人手的速度,AI的决策速度也远远高于机械执行速度,导致落地困难。“新的技术往往得是‘有钱’的领域才敢先用。虽然农业领域很需要AI,但是利润太低,很多地方不会投入。”她分析道。
“如果我继续在一个企业里做这方面的研究,对企业来说太奢侈了,因为研究是需要不断投入。”2021年底,林咏华加入智源,她说,再次进入一个研究机构,是因为看到有很多应该用AI直接解决的问题,AI当时的能力和机械臂等硬件的能力远远不够。
在智源,林咏华和她所带领的技术团队一起正面临一场新的浪潮——DeepSeek所带来的大模型普及。
“我的妈妈和婆婆已经80多岁了,上周末她们同时在不同的群里说,有一个很好的软件叫DeepSeek,她们一直在上面问各种各样老人家关心的问题。”这让林咏华觉得这一波热潮已经完全到来,“DeepSeek深入到老百姓,不再受限于过去只能通过企业或政府采买的形式,这倒逼很多企业尽快上线,所以我认为很重要的一个障碍被推开了。”
另一个尚未被推开的障碍在于成本。
她以DeepSeek为例,如果企业想要部署,可能需要英伟达H100服务器,8张卡还不够,要2台,成本极其高昂。因此,大模型要想可持续发展,必须解决高昂的算力问题。
这涉及两个问题:一是上层算法和系统的优化,二是底层硬件的多样化,只有芯片多样化,才能拉低硬件的门槛。当前,AI芯片市场几乎被英伟达的CUDA生态垄断,全球超过95%的AI训练和推理任务都基于CUDA开发,而其他芯片厂商往往各自为战,形成了割裂的“烟囱式”生态。
要打破这种困境,智源寻找到的路径是开源。例如,DeepSeek推出时,智源就开发并开源了DeepSeek-R1多芯片版本,让用户只需五行命令,就能在非英伟达的AI芯片服务器上部署DeepSeek-R1全流程。
当前,绝大多数模型的开发仍然围绕CUDA生态进行,包括DeepSeek,林咏华希望,未来开发者可以在一个开源统一的生态下进行训练和推理。
这正是智源推动FlagOS的原因,FlagOS是一个面向大模型、支持异构算力的智能计算“操作系统”。
“我们希望上层的用户算法、开发者、模型厂商可以更便捷,不用因为切换芯片公司导致需要替换整个底层架构而担忧,就如同用户可以基于Linux的操作系统上运行MySQL。”林咏华阐述称,统一的生态需要通过开源的方式进行共创,如果不开源,每个环节都以商业谈判和不同的商业条款来制约,不同的芯片厂商无法参与贡献,统一的生态就更无从谈起了。
在林咏华看来,开源的最大优势就是共创。一个模型的第一版开源后,全球的开发者可以接力迭代,让它在极短时间内迅速优化,比如多模态模型LLaVA,短时间内已经衍生出多个版本,每个版本都比前一代更强。“大家像传递接力棒一样,同时资金和人才的投入不需要受制于一个机构自己的经济实力。”
向前一步
林咏华始终不喜欢在“象牙塔”里做科研。
在琼州海峡的海域中央,林咏华曾在轮船甲板上,顶着40摄氏度的高温,跟团队一起完成新研发的无线通讯技术的验证。在山西五台县零下20多度超低温的环境中,林咏华团队通过无线通讯的方式,实现了当时移动通信无法覆盖的测试。
“通讯需要在不同环境里验证,虽然我们可以在模拟信道的环境中验证,但实际上很多问题是无法在模拟环境中能够被发现的。”数次穿梭在酷暑与极寒中,林咏华最终带领团队第一次用“标准的IT服务器架构+虚拟化云计算”支持了2G、3G、4G的无线接入网络;与中国移动等全球领先的运营商一同,开拓了C-RAN(Cloud RAN),把传统无线领域的专用设备用软件定义的方式在云平台上运行,如今,C-RAN已经成为5G通信架构的核心。
“科研第一要十分注重细节,第二不能在象牙塔里做科研,一定要上‘战场’。”这是长期以来林咏华对科研的态度,这个态度同样影响着她在智源的探索。
林咏华很喜欢自己的总工程师的头衔,在技术世界里,女性往往是少数派,偏见也可能随之而来。
脸书(Facebook)的前女性高管谢丽尔·桑德伯格在《向前一步》中提到,有能力的人因自我怀疑而苦恼,这种现象有它的学名——“负担症候群”(imposter syndrome)。无论男女都容易出现这样的症状,但女性会更严重,也会更多地受其限制。
林咏华有同样的感受,如果同样坐在一个桌子上,但当不介绍自己的背景,不主动“推销”自己时,尤其在技术领域,女性很多时候不会是第一个被提问的人。
如何让别人知道自己能做这件事?只有主动“推销”自己。这件事无关性别,对谁都不容易,只是女性需要更多的主动推销,才有可能赢得更多的机会。
“一定要勇敢一些。”这是林咏华给想要从事人工智能技术的年轻女性提出的第一个建议。
她的第二个建议是,利用好自己的优势。当女性希望做到更具领导力时,合作是一个很重要的问题,也是一个难题,如果能够协作更多的团队,那么她有机会比男性更有竞争力。
如果要成为一个出色的研究员或者一个出色的技术领导人,“以身作则”是更重要的事。如今,林咏华仍会每周阅读新鲜出炉的论文、下载最新模型调试试用,来掌握第一手的技术信息。“技术负责人一定要有足够的触觉去感受外面的世界,否则我们很容易闭门造车。”