Route
Contact aiyouxitiyu
2025-02-05 09:23:31
爱游戏- 爱游戏体育- AYX爱游戏体育官方网站
相比之下,Meta 在 54 天内使用具有 16384 个 H100 GPU 的超级计算机,用 4050 亿个参数训练其具有 4050 亿个参数的 Llama 3 模型,计算资源增加了 11 倍(3080 万个 GPU 小时)。显然,DeepSeek R1 消耗的资源也比竞争模型少。但是,R1 也有可能在比 V3 使用的集群更强大的集群上进行训练。外界认为DeepSeek公司拥有5万张H100 GPU计算卡。
根据半导体研究机构SemiAnalysis则认为,DeepSeek囤积了6万张英伟达GPU卡,其中包括1万张A100、1万张H100、1万张“版”H800、3万张“版”H20,算力资本支出的总体拥有成本(TCO)超过140亿元,达19.96亿美元(约合人民币143.45亿元)。DeepSeek 的总服务器资本支出约为 16.29 亿美元,运营此类集群的成本高达 9.44 亿美元,因此总体的成本可能高达 25.73 亿美元。这一假设导致外界猜测DeepSeek依赖于非合规途径获得的大量对华禁售的英伟达AI GPU。
近年来,美国一直在持续收紧对向中国出口先进 GPU 的限制。2022年10月,美国正式推出了对华高性能AI芯片的出口限制,随后在2023年又进一步扩大限制范围,英伟达对华的A800/H800也受到了限制。与此同时,美国还限制了无需美国商务部出口许可证即可出售给中国和其他多个国家的 GPU 的性能。然而,新加坡此前并不在限制国家之列,因此有猜测认为DeepSeek是通过监管漏洞获得了英伟达高端 H100 GPU。
值得一提的是,受DeepSeek引发的“中国在AI领域正超越美国”的影响。当地时间1月29日,美国密苏里州共和党参议员乔希霍利(Josh Hawley)还提出了一项旨在保护美国人工智能(AI)发展不受中国影响的法案《2025年美中人工智能能力脱钩法案》(Decoupling Americas Artificial Intelligence Capabilities from China Act),希望禁止从中国进口或向中国出口人工智能技术;禁止美国公司在中国进行AI研究或与中国公司合作开展AI研究;禁止美国公司投资中国的AI开发。
“对那些看到DeepSeek表现并认为中国在AI领域正超越美国的人而言,你的解读错了,正确解读应是开源模型正超越专有模型。DeepSeek 从开放研究和开源获益良多(如同PyTorch和Llama),他们提出新想法,并从其他人的工作基础加以建构。他们发布新的模型并开源,所以每个人都能从中受益,这就是开放研究和开源的力量。”Yann LeCun说道。
搜索您想要找的内容!
地址:广东省广州市 电话:020-66889888 手机:13988889999
Copyright © 2018-2024 爱游戏体育官方网站 版权所有 非商用版本 ICP备案编号: