开云kaiyun.comDeepSeek降价正刚直当-Kaiyun体育下载

发布日期：2026-05-03 07:40 点击次数：140

21世纪经济报谈记者彭新开云kaiyun.com

重塑订价钱局，DeepSeek再度登场。

4月26日，DeepSeek发布API价钱调换公告，全系API输入缓存射中价钱降至首发价的十分之一，其中，Pro模子在2026年5月5日前还可重叠2.5折限时优惠。

DeepSeek官方API订价页炫夸，本次降价遮掩V4系列全模子，中枢调换聚合在输入缓存射中场景。调价后，DeepSeek-V4-Flash每百万Tokens（词元）输入缓存射中价钱为0.02元，DeepSeek-V4-Pro为0.025元。

面向企业级用户的DeepSeek-V4-Pro降价幅度更大，原价1元/百万Tokens的缓存输入降至0.1元，2026年5月5日前重叠2.5折限时特惠，履行仅0.025元/百万Tokens，缓存未射中输入从12元降至3元，缓存未射中输出从24元降至6元。

此轮降价意味着，责罚换取百万Token的长文本或复杂智能体任务时，DeepSeek操办模子的成本被拉卓越低的进程，对成立者而言，将不错以极低成本对DeepSeek V4进行评估测试。

有成立者合计，DeepSeek V4在工程层面进行了多项技艺立异，成果较前代成倍普及——在百万级调用场景下，单Token推理算力花消已降至V3.2的27%，KV cache（键值缓存，大模子推理经过中占用显存的主要部分之一）的显存占用仅为底本的10%。在此基础上，DeepSeek降价正刚直当。

价钱攻势冲刺专科客户

动作开源模子，DeepSeek历来以“廉价+开源”政策引诱成立者生态，并在性能上接近于率先的闭源模子，成为专科客户的性价比选定。

DeepSeek-V4按大小分为Pro和Flash两个版块，其中V4-Pro总参数为1.6万亿，激活参数490亿，是迄今纵容参数目最大的开源权重模子，定位高性能任务；V4-Flash总参数2840亿，激活参数130亿，主打低成本和高糊涂，约略提供愈加速捷、经济的API办事。两款模子均接收MoE架构，也等于“羼杂大家模子”。

DeepSeek坦言，在Agentic Coding（智能体编程）评测中，DeepSeek-V4代码请托质料接近Claude Opus 4.6非想考形式，但仍与Opus 4.6想考形式存在一定差距；此外，DeepSeek-V4谢寰球常识测评中仅次于Gemini-Pro-3.1，但跨越同期其他开源模子，在数学、STEM、竞赛型代码的测评中则并列寰球顶级闭源模子。

从价钱上来看，V4-Flash走的是普惠路子，输入缓存射中0.02元/百万Tokens、未射中1元/百万Tokens、输出2元/百万Tokens的报价，对应中小成立者与轻量诓骗调用场景。V4-Pro更具性价比，其原价输出24元/百万Tokens的水平本就高于V4-Flash，但限时扣头后输出仅6元/百万Tokens，与上一代V3.2系列价钱相称，却对应着1.6万亿参数的旗舰模子智商，极具性价比。

另一方面，DeepSeek也在积极适配国产算力，DeepSeek在订价证明中提到，受限于高端算力，当今Pro版办事糊涂十分有限，预测下半年昇腾950超节点批量上市后，Pro价钱会大幅下调。这意味着，DeepSeek订价将有进一步下探空间。

履行上，DeepSeek正在积极适配国产算力，将V4的早期走访权限优先洞开给国内芯片厂商，而非英伟达、AMD等国外厂商，这被业内视为DeepSeek模子适配政策的关键转向。

阐明华为公开信息，昇腾超节点全系列产物已全面适配DeepSeek V4，可竣事V4-Pro约20毫秒、V4-Flash约10毫秒的低时延推理。基于昇腾950超节点，V4-Pro在8K输入场景下单卡Decode糊涂约4700 TPS；V4-Flash在同等输入场景下单卡Decode糊涂约1600 TPS。基于昇腾A3 64卡超节点的大EP（大家并行）部署形式下，V4-Flash在8K输入、1K输出场景下基于vLLM推理引擎可竣事2000 TPS以上的单卡Decode糊涂。

摩尔线程露馅，其联袂上海AI实验室DeepLink团队，率先在AI训推一体智算卡MTT S5000上完成了核默算子Day-0适配。当今算子通过率已超80%，竣事了模子发布与国产算力适配的同步落地。

竞争日趋强烈

这次降价正好寰球大模子厂商竞相以更廉价钱、更高成果争夺成立者和企业客户之际。跟着企业级用户从早期试点转向界限化部署，推理和调用成本已取代单纯模子智商，成为大模子厂商间竞争的重要身分。业内预测，DeepSeek此轮调价将进一步压低同业报价。

花旗在其最新研报指出，DeepSeek V4-Pro在中枢AI性能主义上已与顶尖闭源模子Claude Sonnet 4.6推崇握平，同期订价却远低于GPT-5.5。花旗合计，这一时势突涌现时AI大模子赛谈中开源模子与闭源率先模子日益加重的南北极分化趋势。收货于极具成本竞争力的底层架构，开源模子在代码生成、智能体使命流及长文本等诓骗场景中，与闭源巨头的差距正在纰漏。

在国产模子阵营里面，DeepSeek V4-Pro的限时扣头价亦彰着低于多半同档位产物。按输出端价钱设想，DeepSeek V4-Pro扣头价为0.87好意思元/百万Tokens；智谱GLM-5.1、月之暗面Kimi K2.6的输出端报价诀别为4.4好意思元/百万Tokens和4.0好意思元/百万Tokens，约为其5倍和4.6倍。

阐明在寰球最大的API团员平台OpenRouter现时报价，阿里Qwen3.6 Plus输出端约为1.95好意思元/百万Tokens；MiniMax官方价钱炫夸，MiniMax M2.7输出端为1.2好意思元/百万Tokens。轻量档位中，阶跃星辰Step 3.5 Flash按OpenRouter报价为0.10好意思元输入/百万Tokens、0.30好意思元输出/百万Tokens，输出端与DeepSeek-V4-Flash的0.28好意思元/百万Tokens较为接近。

记者看到，OpenRouter上，DeepSeek V4系列模子的调用运转大幅增长，4月26日，DeepSeek V4-Flash的调用量为814亿Tokens，DeepSeek V4 Pro的调用量为96亿Tokens，带动DeepSeek在OpenRouter平台的总调用量创近期新高。

当今，DeepSeek依然激励成本市集对其竞争敌手的重新订价。4月27日，两大模子厂商股价重挫，MiniMax股价报收750.00港元/股，跌3.54%；智谱股价报收914.5港元/股，跌2.19%。

此外，DeepSeek近期传出融资音讯。有市集音讯称，腾讯和阿里正在构兵DeepSeek融资事宜，公司估值或跨越200亿好意思元，但具体融资额及估值可能随磋商握续调换。

更多内容请下载21财经APP开云kaiyun.com