17c.aps
其实近年来,AI,或者说的更准确一些,是“生成式人工智能”概念在全世界引起的关注已经超过了这个技术在当前实际具备的价值。不仅华尔街和硅谷对这个概念趋之若鹜,更重要的是基于此前美国各公司的技术路径,衍生出来的“培训大模型需要巨量的算力和电力”的概念,使其在具备实用价值前就先成为能源行业和计算机硬件制造商最爱的商业噱头。
“我不认为在场馆中的观众会要求我们缩短比赛时间,但作为电视节目来说,比赛时长控制在两小时更为合适。奥运篮球比赛就是两小时,大学篮球比赛也是。我觉得这对比赛的形式有一定的推动作用,但这对比赛来说是一个巨大的改变,像这样的事情必须经过更多的讨论。”萧华说道。,第一反应!阿德巴约更推:是有人偷了Shams的手机吗?
整部电影其实没啥逻辑,比如上古奇石很重要,玉帝曾经派出了10万天兵天将都没有找到,结果王嘉诚通过人间的天网系统就轻松锁定了王小花,这玉帝的法力还不如摄像头是吧?
老鹰前48场22胜26负,过去7场遭遇7连败。步行者前46场26胜20负,过去两场战胜马刺与活塞收获2连胜。本场老鹰缺少卡佩拉、博格丹、杰伦等,步行者缺少怀斯曼。首节开局步行者4-9落后,随后步行者打出一波24-6攻势,已经以28-15反超老鹰13分优势。步行者继续压制老鹰扩大领先优势,首节比赛结束步行者40-24领先老鹰16分优势。
火锅店老板:这个50多万元的盈利,只扣除了食材成本,并不是纯利润。我们发的钱多,不代表利润高。因为我们没有算员工的工资,房租、水电气费和税费这些,都是公司在承担,没有算在这次分的钱里面。
DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例,Claude 3.5 Sonnet 是一个中等规模的模型,训练成本达 数千万美元,远不是数十亿美元级别。 并且,Claude 3.5 Sonnet 训练于 9-12 个月前,而 DeepSeek 的模型训练于 2023 年 11 月至 12 月,即便如此,Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍,那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。 然而,DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍,这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着,如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍,那其实完全符合正常趋势。 我虽不便给出确切数字,但从前面的分析可以看出,即使接受 DeepSeek 的训练成本数据,他们也只是处于趋势线上,甚至可能还未完全达到。 比如,这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异(10 倍)要小,而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明,DeepSeek-V3 并非独特的突破,也没有从根本上改变 LLM 的经济性,它只是持续成本降低曲线上一个预期的点。 不同的是,这次第一个展示预期成本降低的公司是中国的,这在以往从未有过,具有重大的地缘政治意义。不过,美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低,而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司,但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样,美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek,而是因为它们本就沿着同样的技术路线前进。
马斯克为xAI投入巨资,仅在2024年就累计融资120亿美元,估值400亿美元。在马斯克这块金字招牌的吸引下,xAI得到科技圈各路大佬的加持,比如英伟达、AMD这样的芯片公司,又比如黑石、富达、光速、红杉、摩根士丹利等顶级投行。