DeepSeek官网最近用起来很不爽,经常卡顿,无法搜索,甚至直接拒绝服务,显示“服务器繁忙,请稍后再试”。想到很多第三方都开始提供DeepSeek模型的服务,以下汇总一些,大家自行选择,拿走不谢。(本想列入某国字头超算机构,尝试了几天,发现果然不出所料,这些机构永远做不好公共服务)。
截至2025年2月7日,DeepSeek大模型已获得全球超过10家中外云厂商和科技巨头的支持,涵盖国内外主流云平台、AI基础设施厂商及芯片企业。以下是具体合作信息汇总:
一、国内云厂商及服务方式
- 华为云
- 服务方式:基于昇腾云服务的本地部署,支持R1、V3及蒸馏模型,提供“一键部署”功能,集成动态换入换出、全局缓存优化等特性。
- 版本支持:R1(671B)、V3(MoE架构,6710亿参数)及蒸馏版(如1.5B-70B)。
- 价格:R1刊例价为输入4元/百万Token,输出16元/百万Token;V3限时优惠至输入2元/百万Token,输出8元/百万Token。
- 腾讯云
- 服务方式:通过高性能应用服务HAI实现“3分钟调用”,支持全系模型(从1.5B到671B),提供灵活付费模式及API调用。
- 版本支持:满血版671B、轻量版1.5B-14B蒸馏模型。
- 价格:限时免费体验,付费模式灵活(未公开具体价格)。
- 阿里云
- 服务方式:PAI平台一键部署,支持vLLM加速和Web应用部署,集成安全算子和日志分析功能。
- 版本支持:V3、R1及蒸馏模型(如Qwen-7B)。
- 价格:限时免费1000万Token,后续价格未公开。
- 百度智能云
- 服务方式:千帆平台提供安全增强版模型,支持BLS日志和BCM告警,限时免费两周。
- 版本支持:R1和V3模型。
- 价格:R1输入价2元/百万Token(官方半价),V3输入价0.8元/百万Token。
- 火山引擎(字节跳动)
- 服务方式:机器学习平台veMLP支持全尺寸模型部署,自研推理引擎优化性能;火山方舟提供API调用。
- 版本支持:V3、R1全尺寸模型及蒸馏版。
- 价格:未公开,但提供全网最高限流保障。
- 运营商云平台(移动云、联通云、天翼云)
- 服务方式:全栈国产化适配,覆盖私有化与公有化场景,支持多规格算力卡(如A800、H800)。
- 版本支持:R1、V3及蒸馏模型(1.5B-70B)。
- 价格:限时免费(如天翼云提供无上限免费API调用)。
二、国际云厂商及服务方式
- 微软Azure
- 服务方式:通过Azure AI Foundry提供R1模型,支持本地运行(精简版)和云应用集成。
- 版本支持:R1全量参数及蒸馏版。
- 价格:未公开,参考官网刊例价。
- 亚马逊AWS
- 服务方式:通过Bedrock和SageMaker部署R1模型,支持企业级SLA和安全承诺。
- 版本支持:R1全量参数模型。
- 价格:未公开,可能接近官网价格。
- 英伟达
- 服务方式:通过NVIDIA NIM提供R1推理服务,单H200系统支持每秒3872 Token处理。
- 版本支持:R1 671B满血版。
- 价格:未公开,需按算力资源计费。
- AMD
- 服务方式:在Instinct MI300X GPU上优化V3推理性能,支持FP8精度。
- 版本支持:V3及蒸馏版。
- 价格:未公开,可能低于英伟达同类服务。
另外Perplexity.ai、Monica等第三方服务都集成了DeepSeek。
三、价格策略与市场竞争
- 官方定价:
- R1输入4元/百万Token,输出16元/百万Token;
- V3输入2元/百万Token,输出8元/百万Token。
- 折扣与免费政策:
- 百度、阿里云、天翼云等推出限时免费(如1000万Token或两周免费);
- 华为云与硅基流动平台限时优惠至2月8日。
四、技术亮点与行业影响
- 低成本优势:DeepSeek以3%的成本对标OpenAI,训练成本仅557.6万美元(对比Claude 3.5的数亿美元)。
- 开源生态:MIT协议开源模型权重,支持商业化和二次开发,推动国产算力适配(如华为昇腾、摩尔线程GPU)。
- 技术突破:FP8训练降低算力门槛,MoE架构优化推理效率,万卡集群驱动降本。
总结
DeepSeek已覆盖国内外主流云平台,其开源、低成本特性加速了AI应用普及。国内厂商通过价格战和本地化部署抢占市场,国际厂商则依托技术生态扩大服务范围。未来,随着推理需求增长和国产算力成熟,DeepSeek或将成为全球AI基础设施的核心组件之一。
当然,如果有条件,最好还是自己在本地安装一套DS服务,可以避免带宽或响应迟钝、收费不透明、数据安全隐私泄露等问题。最近调研下各种可行的技术方案,以及搭建成本,以及进一步开发可以满足哪些应用需求。敬请期待😊。

留下评论