张津渝落地窗9分56秒
通过Kimi、DeepSeek等模型的持续突破,“中国企业展现出强大的创新能力,在视频生成等特定领域甚至已经实现了局部领先。”吴恩达点评道。
全球石油消费增长引擎也发生了变化。陆如泉介绍,2024年全球石油需求增长为90万桶/天,其中中国的需求增量仅为1万桶/天,而印度的需求增量达到20万桶/天。过去中国石油消费增量占全球的一半到三分之二,如今印度取代中国成为全球石油消费增长的新引擎,这个态势在未来一段时期将会持续。,被DeepSeek重击的,还有石油巨头的“AI能源梦”
而这也是让他怀着敬畏之心,不能糟蹋观众给的机会,必须倾其所有去实现最好的效果。一定要做观众没看过的、能造成强烈视觉冲击的东西——这样才有价值。
由执政党控制的萨尔瓦多议会刚刚低调通过了对《比特币法案》的改革,不再将比特币作为官方货币,把使用权交由用户自行决定。这项改革是在国际货币基金组织施加了近两年的压力之后进行的。国际货币基金组织将“降低比特币风险”作为批准萨尔瓦多纳伊布·布克尔政府急需的14亿美元贷款的交换条件。如果萨尔瓦多政府想要获得这笔贷款,就必须在1月31日最后期限前对该法案进行改革。
DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例,Claude 3.5 Sonnet 是一个中等规模的模型,训练成本达 数千万美元,远不是数十亿美元级别。 并且,Claude 3.5 Sonnet 训练于 9-12 个月前,而 DeepSeek 的模型训练于 2023 年 11 月至 12 月,即便如此,Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍,那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。 然而,DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍,这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着,如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍,那其实完全符合正常趋势。 我虽不便给出确切数字,但从前面的分析可以看出,即使接受 DeepSeek 的训练成本数据,他们也只是处于趋势线上,甚至可能还未完全达到。 比如,这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异(10 倍)要小,而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明,DeepSeek-V3 并非独特的突破,也没有从根本上改变 LLM 的经济性,它只是持续成本降低曲线上一个预期的点。 不同的是,这次第一个展示预期成本降低的公司是中国的,这在以往从未有过,具有重大的地缘政治意义。不过,美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低,而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司,但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样,美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek,而是因为它们本就沿着同样的技术路线前进。
人工智能和合成生物学两股浪潮汹涌汇聚,形成前所未有的巨浪。在某种程度上,人工智能与合成生物学甚至可以互换概念。毕竟,迄今为止所有的智能都源于生命。称之为合成智能或人工生命,其本质并无二致,这两个领域都致力于重新创造、设计这些基础且相互关联的概念,它们是人类两大核心属性的体现。换个角度看,它们其实是一个整体。
2月3日,台湾省知名女演员大S被曝离世,据悉她趁着春节假期带全家跟团前往日本旅游度假,但因感染流感,导致肺炎,虽第一时间就被送往日本最有名的医院进行救治,但最终仍未抢救过来了,就这样遗憾告别,享年48岁。