卫星健康管理一直是航天业的热门话题——对卫星的精心呵护可以极大延长卫星的“寿命”,从而节省卫星的建造和发射成本,因此,巨大的经济价值蕴藏其中。如今,人工智能大模型正在这一领域初试牛刀。
2024年10月,西安中科天塔科技股份有限公司(以下简称“中科天塔”)发布航天私域大模型“华山”,可通过语音、文本互动,实现航天器在轨管理和航天器管理人员培训。随后,中科天塔完成近亿元A轮融资,进一步加码航天私域大模型产品。
当前,卫星互联网已步入加速建设期。随着在轨卫星数量的爆发式增长,卫星管理业务也将被同步推至新的数量级,人工智能的优势和潜力愈发凸显,这也是中科天塔CTO董卫华坚定看好大模型价值的初衷。
董卫华在接受《每日经济新闻》记者专访时坦言,业内一直对人工智能抱有很大的期望,而ChatGPT这样的大语言模型的出现,为行业带来了更多的技术手段和价值。在董卫华看来,大模型至少会成为一个非常好的助手,同时,随着研究的深入,大模型展现出来的能力很有可能完全颠覆整个卫星控制,实现完全的自动化和智能化。
董卫华
卫星“医生”期待人工智能
NBD:AI技术与卫星健康管理业务的接合点从何而来?
董卫华:卫星健康管理的内涵可以分为三层。
第一层,在卫星出现故障后,地面人员(或系统)能够对故障快速定位、快速解决;第二层,预测故障,有一些故障在发端之前是有端倪的,要能够预测故障并及时处理;第三层则是实现星上自动诊断,让卫星能够与地面人员共同“讨论”、解决问题。
第三层,也就是最后一层,目前还没有实现,但这是大家共同追求的一个更大的目标,原因在于,前面两层其实都需要地面工作人员的强力配合,但随着卫星数量的增加,人力已经慢慢没有办法承担这个工作量。
卫星数量增加后,相关专业知识也会累积得越来越多,仅靠一两个卫星工程师很难完成这些知识的整理工作。例如,故障的条目尽管各自独立,但故障之间其实有关联性,在关联性越来越多的时候,人脑很多情况下已经无法处理了。
特别是担当卫星管理工作的一般都是基础人员,他们本身对这个领域专业知识的掌握度就不足,难度也就更大了。因此,业内通用的想法是,由计算机代替人来处理这些知识和关联性,人则负责提供所需的技术支持。
此外,随着深空项目的增加,时延的问题也会更加突出。以火星探测为例,火星到地球的信号传输时间长达八分钟,等故障出现之后,人再去做判断,一来一回可能就要耗费半个小时。因此,未来肯定要依靠卫星等航天器的自主能力,使计算机在经过专门训练后,实现快速诊断,更高效地完成处置工作。
基于这两点,在卫星健康管理领域,业内一直对人工智能抱有很大的期望。实际上,我们一直在做人工智能算法方面的研究工作,ChatGPT这样的大语言模型出来后,我们也希望它能为我们带来更多的技术手段和价值。
NBD:以公司的“华山”大模型为例,如何赋能卫星健康管理?
董卫华:卫星健康管理作为地面工程师日常最常用的功能,几乎每时每刻都要用,假如卫星的寿命是20年,这个功能就要伴随卫星运行20年。不过,卫星在轨运行时常会出现各种各样不常见的故障,这就要求地面故障诊断系统拥有足够的灵活性。
但目前行业面临的最大问题就是,一旦卫星出现一些极端的异常情况,传统的健康管理系统会完全失效,对地面人员也没有任何帮助。我们认为,大模型这样的人工智能算法拥有足够的灵活性,只要用更多的数据、更多的知识武装它的“头脑”,理论上能够比投入一线的卫星管理人员的能力更强。
一般卫星的管理团队分为前后台,前台人员负责一些基础的工作,7×24小时对卫星做长期、持续的监视和控制;后台是更有经验的专家,这些专家在那些极端异常情况发生时,为前端的同事提供技术和知识经验的支撑,我们的目标就是在“后台”的部分发挥作用。
我们的大模型训练好之后,可以取代部分后台专家的一些工作,减轻他们的工作量。因为随着卫星规模的增加,这样的故障会频繁出现,专家支持的强度也会非常大。我们希望利用大模型这样的技术手段,替代这些专家的经验和知识,为前台的技术人员提供辅助和支撑。
这是一个比较稳妥的思路,也是最有意义的思路,因为这部分工作的强度确实在逐年增加,用大模型能很好地把强度降下来。此外,随着我们研究的深入,我们认为大模型展现出来的能力,很有可能完全颠覆整个卫星控制,变成完全的自动化和智能化,这是我们新的目标。
大模型有上限,但至少是一个好助手
NBD:公司为什么选择自研大模型?
董卫华:一开始我们并没有打算推出自己的模型,而是计划在第三方模型的基础上开发智能化应用,来解决我们行业中的问题,但我们发现,通用模型难以满足我们这一行业的特殊需求。
大语言模型由于是生成式人工智能,所以时常会胡言乱语。但在卫星健康管理领域,大模型的反馈结果哪怕有一些瑕疵也是无法容忍的。举个例子,卫星出现故障,工程师问大模型故障是什么、如何解决,假如大模型不知道,但编造出了故障理由和处置方法,那这是非常吓人的。
因此,我们需要限制大模型的知识输出,要求大模型的所有判断都要有依据、有原则,且能够充分理解航天领域的各种术语。但不管我们怎么去写提示词,包括提出特殊的限制和要求,通用模型可能都很难达到期望效果,所以最后我们也是迫不得已才去训练自己的模型。
做一个类比的话,通用大模型就像一个刚刚毕业进入行业的大学生,他的通用技能是基础,但专业技能才是做好手头工作的必备条件,因此他一定要经过行业的专业培训,重塑一个航天的世界观;同时,也只有突破了专业技能这层窗户纸,他的通用技能才能慢慢发挥价值。
就“华山”大模型而言,它的能力接近一个人刚入行一两年的水平,可以做一些简单的工作,理解一些简单的问题,一旦进入特别复杂的问题,其实它的能力是远远不够的,这时候可能需要更大的算力,我们正在解决这样的问题。
NBD:公司如何解决大模型出现的“幻觉”问题?
董卫华:目前行业内有一些专门的技术可以解决部分问题,可以通过给大模型明确的要求,来减少“幻觉”的输出。另外就是通过训练的方式,构造各种训练数据,让大模型获知哪些情况下不允许随意发挥。这是目前两种通用的手段,解决了现在百分之八九十的问题,但是还有10%始终消除不了。
NBD:为什么有10%始终无法消除?
董卫华:我认为这可能是技术本身造成的,从算法机制上来讲,大语言模型是生成式人工智能,其实际上是一个概率计算问题,有一部分概率就是在你的控制范围之外的。那么,在知道技术的上限后如何用好技术,就是我们技术研发人员的职责。
大模型很有可能没有办法像想象中那样大量替代现有人员,但我认为,它至少会成为一个非常好的助手。助手可以允许犯错,同时助手能够大大简化个人的工作量和工作强度,目前来看,这也是大模型在我们这个专业领域里实现应用的一个比较现实的想法。
未来十年,大模型重塑航天业
NBD:您如何看待大模型对航天业的远期影响?
董卫华:其实,航天业各个领域的技术成熟度是非常高的,但我认为未来十年,航天业的各个领域——哪怕是再小、再专的一个领域,都会用大模型技术对领域原有的技术进行重塑,可能是解决、优化原先存在的问题和不足,甚至对原先做的好的地方也会有加持。
对我们公司来讲,大模型也是未来公司最主要的发展方向。我们希望利用我们的经验和模型为航天的专业领域赋能,目前已经对接了大致4到5家用户,计划今年让现有的模型能够在卫星健康管理领域落地。
大模型真正有什么好处,我认为只有用过之后才能发现它的价值,这也是我们自身的实践经验,一开始我们只是把大模型当做一个聊天工具,但有一次在做一个功能设计的时候,我突然意识到,我应该把它当成一个“人”来看待。
当然,因为大模型不是通用人工智能,所以它还不能变成一个通用的人,但是在某一个领域里面,就应该把它当成一个“人”来看待,我们应该想怎么训练他,让这个人了解他的工作、怎么去完成工作,而这个训练工作一定是需要这个行业去做的,否则大模型永远无法为你提供价值,只能是一个聊天工具。
只有用大模型去完成你的工作,把它当作一位新来的同事去训练它,它才可能给你带来价值,否则大模型至少在某些行业特别是垂直领域里面,价值还是零。
NBD:目前公司针对大模型产品有哪些开发方向?
董卫华:首先,我们计划实现大模型在卫星健康管理领域的落地,一开始我们预想产品部署上去后可以很快发挥作用,但目前来看,可能还需要跟用户一起对大模型的正确性做很长时间的确认,才能真正发挥作用。
其次,我们希望突破大模型在卫星轨道控制、计算领域的应用,让“华山”大模型达到一名初级轨道控制工程师的水平。我们的最终目标是让大语言模型能够在卫星上真正发挥作用,健康管理是一方面,轨道控制是另外一方面,即卫星发现问题后,可以自主地对自己的轨道进行调整和变化。
此外,目前我们更多是在私域领域向客户推广,但也希望我们的模型能够为更多商业航天公司赋能,因此我们计划打造一个行业线上工具,面向中国商业航天的用户开放访问权限,让大家体验一下如何用大模型去做一些文档生成式的工作,这也是航天项目和航天公司日常工作中经常出现的一项需求。