《科创板日报》2月18日讯(编辑 宋子乔) 2月18日,DeepSeek团队发布一篇论文介绍了新的注意力机制NSA(Natively Sparse Attention,原生稀疏注意力机制)。 ...
1月27日凌晨,阿里云通义开源支持100万Tokens上下文的Qwen2.5-1M模型,推出7B及14B两个尺寸,均在处理长文本任务中稳定超越GPT-4o-mini;同时开源推理框架,在处理百万级别长 ...
1月27日,阿里云通义千问Qwen团队正式推出开源的Qwen2.5-1M模型及其对应的推理框架支持。 ...
1月8日,阿里云宣布通义灵码AI程序员全面上线。 ...
从流媒体服务上的个性化推荐,到帮助规划日程的人工智能(AI)助手,AI正在悄然改变着人们的生活。而对于企业而言,这一变革才刚刚开始。 ...
8月7日,月之暗面旗下Kimi开放平台宣布上下文缓存Cache存储费用降价50%。Cache存储费用由10元/1Mtokens/min,降低至5元/1Mtokens/min。 ...
财联社8月7日电,月之暗面宣布,Kimi开放平台的上下文缓存Cache存储费用降价50%,Cache存储费用由10元/1Mtokens/min降低至5元/1Mtokens/min,价格生效时间为20 ...
8月2日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。 ...
财联社7月23日电,Meta当地时间7月23日发布LLAMA 3.1 405B开源人工智能模型。 ...
7月2日,甲骨文官微宣布正式推出HeatWave GenAI,其中包含数据库内大语言模型(LLMs)、自动化数据库内向量存储、可扩展向量处理,以及基于非结构化内容进行自然语言上下文对话的能力。 ...
《科创板日报》7日讯,阿里通义千问Qwen2 大模型今日发布,并在 Hugging Face和 ModelScope上同步开源。 ...
《科创板日报》21日讯,百度智能云宣布文心大模型两大主力模型全面免费。分别为今年3月推出的两款轻量级大模型ERNIE Speed、ERNIE Lite,支持8K和128k上下文长度。 ...
每经记者 赵雯琪每经编辑 刘雪梅 从创业狂潮到争相落地,国产大模型进入了新的竞争阶段。 5月7日,零一万物官宣了一站式AI工作平台——万知。 ...
5月6日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”正式开源第二代MoE模型:DeepSeek-V2。 ...
4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。 ...

关注我们的公众号

微信公众号