上下文 – 编程日记

deepseek 上下文推理梁文锋算法论文

梁文锋参与著作！DeepSeek最新论文介绍新机制可使AI模型进一步降本增效

《科创板日报》2月18日讯（编辑宋子乔） 2月18日，DeepSeek团队发布一篇论文介绍了新的注意力机制NSA（Natively Sparse Attention，原生稀疏注意力机制）。 ...

fengjun
热点
2025-02-18
14

tokens 上下文大模型知名企业长文本模型阿里云

阿里云通义开源长文本模型及推理框架百万Tokens处理速度提升近7倍

1月27日凌晨，阿里云通义开源支持100万Tokens上下文的Qwen2.5-1M模型，推出7B及14B两个尺寸，均在处理长文本任务中稳定超越GPT-4o-mini；同时开源推理框架，在处理百万级别长 ...

fengjun
热点
2025-01-27
19

qwen 上下文推理知名企业视频生成模型阿里云

阿里云通义千问推出开源Qwen2.5-1M模型

1月27日，阿里云通义千问Qwen团队正式推出开源的Qwen2.5-1M模型及其对应的推理框架支持。 ...

fengjun
热点
2025-01-27
25

上下文知名企业程序员通义灵码阿里云

阿里云宣布通义灵码AI程序员全面上线

1月8日，阿里云宣布通义灵码AI程序员全面上线。 ...

fengjun
热点
2025-01-08
36

上下文大模型数据源智能体知名企业知识库谷歌

AI五大趋势将重塑企业！谷歌云重磅报告：2025年将是关键一年

从流媒体服务上的个性化推荐，到帮助规划日程的人工智能（AI）助手，AI正在悄然改变着人们的生活。而对于企业而言，这一变革才刚刚开始。 ...

fengjun
热点
2024-12-19
37

kimi 上下文开放平台

Kimi开放平台：上下文缓存Cache存储费用降价50%

8月7日，月之暗面旗下Kimi开放平台宣布上下文缓存Cache存储费用降价50%。Cache存储费用由10元/1Mtokens/min，降低至5元/1Mtokens/min。 ...

fengjun
热点
2024-08-07
46

kimi 上下文存储费用微处理器月之暗面缓存

月之暗面宣布：上下文缓存Cache存储费用降价50%

财联社8月7日电，月之暗面宣布，Kimi开放平台的上下文缓存Cache存储费用降价50%，Cache存储费用由10元/1Mtokens/min降低至5元/1Mtokens/min，价格生效时间为20 ...

fengjun
热点
2024-08-07
48

deepseek 上下文分布式幻方量化硬盘缓存阵列

幻方量化旗下大模型厂商DeepSeek启用硬盘缓存技术

8月2日，私募巨头幻方量化官微宣布，其探索AGI（通用人工智能）的新组织“深度求索（DeepSeek）”启用上下文硬盘缓存技术，把预计未来会重复使用的内容，缓存在分布式的硬盘阵列中。 ...

fengjun
热点
2024-08-02
46

llama meta 上下文人工智能大语言模型

Meta发布LLAMA 3.1 405B开源人工智能模型

财联社7月23日电，Meta当地时间7月23日发布LLAMA 3.1 405B开源人工智能模型。 ...

fengjun
热点
2024-07-23
38

genai Oracle 上下文向量甲骨文公司

甲骨文推出HeatWave GenAI，提供数据库内大模型等

7月2日，甲骨文官微宣布正式推出HeatWave GenAI，其中包含数据库内大语言模型（LLMs）、自动化数据库内向量存储、可扩展向量处理，以及基于非结构化内容进行自然语言上下文对话的能力。 ...

fengjun
热点
2024-07-02
40

上下文千问qwen 阿里巴巴集团

阿里通义千问Qwen2大模型发布并同步开源

《科创板日报》7日讯，阿里通义千问Qwen2 大模型今日发布，并在 Hugging Face和 ModelScope上同步开源。 ...

fengjun
热点
2024-06-07
36

上下文大模型文心智能云

文心大模型两大主力模型免费

《科创板日报》21日讯，百度智能云宣布文心大模型两大主力模型全面免费。分别为今年3月推出的两款轻量级大模型ERNIE Speed、ERNIE Lite，支持8K和128k上下文长度。 ...

fengjun
热点
2024-05-21
42

chatgpt kimi 上下文孟子微软投资者李开复

零一万物首次出新To C 李开复再出马，争夺“中国ChatGPT”心智定位

每经记者赵雯琪每经编辑刘雪梅从创业狂潮到争相落地，国产大模型进入了新的竞争阶段。 5月7日，零一万物官宣了一站式AI工作平台——万知。 ...

fengjun
热点
2024-05-09
89

deepseek moe 上下文幻方量化

幻方量化旗下DeepSeek发布第二代MoE模型

5月6日，私募巨头幻方量化官微宣布，其探索AGI（通用人工智能）的新组织“深度求索（DeepSeek）”正式开源第二代MoE模型：DeepSeek-V2。 ...

fengjun
热点
2024-05-06
39

上下文千问开源参数模型推理视频生成模型解码器通义

通义千问开源千亿级参数模型

4月28日消息，通义千问开源1100亿参数模型Qwen1.5-110B，成为全系列首个千亿级参数开源模型。 ...

fengjun
热点
2024-04-28
47

梁文锋参与著作！DeepSeek最新论文介绍新机制可使AI模型进一步降本增效

阿里云通义开源长文本模型及推理框架百万Tokens处理速度提升近7倍

阿里云通义千问推出开源Qwen2.5-1M模型

阿里云宣布通义灵码AI程序员全面上线

AI五大趋势将重塑企业！谷歌云重磅报告：2025年将是关键一年

Kimi开放平台：上下文缓存Cache存储费用降价50%

月之暗面宣布：上下文缓存Cache存储费用降价50%

幻方量化旗下大模型厂商DeepSeek启用硬盘缓存技术

Meta发布LLAMA 3.1 405B开源人工智能模型

甲骨文推出HeatWave GenAI，提供数据库内大模型等

阿里通义千问Qwen2大模型发布并同步开源

文心大模型两大主力模型免费

零一万物首次出新To C 李开复再出马，争夺“中国ChatGPT”心智定位

幻方量化旗下DeepSeek发布第二代MoE模型

通义千问开源千亿级参数模型

最新文章

苹果将在英国移除“高级数据保护”功能

小马智行正式开通广州自动驾驶示范运营专线

欧盟或将指控谷歌违反《数字市场法案》

交易对价1500万美元！特宝生物看上这家基因治疗公司高瓴、红杉都投了

做全球最大人工智能孵化器！模速空间打造全国首个算力生态平台｜直击GDC

全国首个算力生态平台“模速空间算力生态超市”正式揭幕

华为广州研发中心启用，首批约2000名员工已进驻

苹果iPhone 16e正式开启预购

周鸿祎宣布：取消送车门槛！第二批将送20台车，具体车型公布，此前已送出20辆小鹏MONA M03

搭载普惠GTF发动机的空客A321XLR获欧洲航空安全局型号合格证

标签

关注我们么么哒！

最新文章

苹果将在英国移除“高级数据保护”功能

标签

关注我们 么么哒！

关注我们的公众号

关注我们么么哒！