新闻速览

红桃电影视频：Meta首席科学家杨立昆痛批硅谷“常见病”：一种错误的优越感

2025-02-04

红桃电影视频

不过这一次她并没有回到山东老家过年，而是选择了留在香港豪宅里和家人一起度过这个快乐的时光。看来范冰冰确实是想要在香港扎根，眼看着她和香港名媛圈的关系也越来越密切了。，Meta首席科学家杨立昆痛批硅谷“常见病”：一种错误的优越感

红桃电影视频

尹惠君致辞

薛凯琪将头发盘起，这一发型不仅凸显了她的精致五官，还让整体造型更加干练利落。薛凯琪的妆容简约而不失精致，凸显了她清新自然的气质。淡雅的眼妆和唇色与整体造型相得益彰，让整个人看起来更加脱俗。

杨亚博主持会议

刘委报告

但是，当鲁比奥的意见逐渐失去影响力，当特朗普开始在社交媒体上我行我素之后，想要在国务卿的位置上维持必要的柔韧性与忠诚度将变得更具有挑战性。特朗普亲自挑选的美国国务院发言人塔米·布鲁斯（Tammy Bruce）曾形容鲁比奥是“在房间后面疯狂挥手试图证明自己存在感的小孩”，这可不是什么好兆头。

孙学伟作报告

埃文表示，在中国的这段时间是他人生中最美好的日子，他感谢大家让自己感受到自身的价值，“我做了有意义的事情，希望西方其他人能看到这个视频，中国是个非常了不起的国家。”

杨晴报告

像下面这几款长大衣，不管是大地色还是黑色，都可以选择带有纤细腰带连接的类型，这样可以借助腰带的烘托，来显得腰线更高，从而衬托出上短下长的好看的身材比例。

章成文作报告

至于太阳的其余两位核心杜兰特与布克，太阳已经拒绝了有关他们的所有问价。目前没有任何迹象表明杜兰特想要离队，而布克也从未表达想要离队的企图，因而太阳自然还会围绕如此两大核心建队。

王京英作报告

教育，注定是一个需要长久投入与耐心等待的过程。很多教育成果并非立竿见影，或许要在隔几年甚至十几年后才会悄然显现。这就要求教师必须调整好心态，深刻认识到教育的长期性与复杂性。

牛海英作报告

2025年1月，小鹏汽车以30,350辆的交付量重新夺得造车新势力榜首，而理想汽车则因消费透支影响，成为唯一出现同比环比双降的企业。零跑汽车和蔚来汽车虽有增长，但均面临交付量下降的挑战。其中，蔚来品牌因员工购车政策风波导致乐道品牌交付量显著下滑。此外，哪吒汽车尚未公布交付数据，其在经历危机后正逐步复工并开展E轮融资计划。

李雷报告

DeepSeek 于 2024 年 12 月推出了 DeepSeek-V3，并于 2025 年 1 月 20 日相继发布了 DeepSeek-R1、DeepSeek-R1-Zero（拥有 6710 亿参数）以及参数规模在 15 亿到 700 亿之间的 DeepSeek-R1-Distill 模型。2025 年 1 月 27 日，该公司推出了基于视觉的 Janus-Pro-7B 模型。这些模型已向公众开放，其成本比同类模型低 90% 到 95%，更具性价比。

白聚德报告

观察者网：特朗普对各国“无差别威胁加税”的背后，有分析认为他希望利用关税的收入来弥补在国内推行减税政策的差额。但这种观点在经济学界引发了很大争议。您认为这是特朗普关税威胁的主要目标，还是他希望在别的（如移民、责任分担）议题上换取对方的让步？

一旦运用到真实世界，这 3 条被称为「定律」的东西就会轰然崩塌。例如，巡航导弹、军用无人机就是违反第一和第三定律的机器人。它们由计算机控制，只会做它们被编程去做的事情。如果它们被编程去伤害人类，它们就会伤害人类。

DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例，Claude 3.5 Sonnet 是一个中等规模的模型，训练成本达数千万美元，远不是数十亿美元级别。并且，Claude 3.5 Sonnet 训练于 9-12 个月前，而 DeepSeek 的模型训练于 2023 年 11 月至 12 月，即便如此，Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍，那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。然而，DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍，这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着，如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍，那其实完全符合正常趋势。我虽不便给出确切数字，但从前面的分析可以看出，即使接受 DeepSeek 的训练成本数据，他们也只是处于趋势线上，甚至可能还未完全达到。比如，这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异（10 倍）要小，而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明，DeepSeek-V3 并非独特的突破，也没有从根本上改变 LLM 的经济性，它只是持续成本降低曲线上一个预期的点。不同的是，这次第一个展示预期成本降低的公司是中国的，这在以往从未有过，具有重大的地缘政治意义。不过，美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低，而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司，但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样，美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek，而是因为它们本就沿着同样的技术路线前进。更多推荐：红桃电影视频

来源：王建军

标签：Meta首席科学家杨立昆痛批硅谷“常见病”：一种错误的优越感

相关报道

[2025-02-04] 网友在航班座位下捡到鞭炮？桂林两江国际机场：正在核实调查
[2025-02-04] 手凉啊！哈登半场8投仅2中拿到6分4助三分4中0
[2025-02-04] 状态火热呀！武切维奇打满首节 7中5砍下12分7板2助&3前场板
[2025-02-04] 余承东晒智界R7硕大后备箱：从家乡回深圳带了两大箱子鸡蛋
[2025-02-04] 美媒：特朗普在试探美国总统的权力边界
[2025-02-04] 鲁比奥泼脏水：一旦开战，中国能关闭巴拿马运河
[2025-02-04] 东契奇转发湖人77号球衣照：无论在哪儿打球目标都是总冠军！
[2025-02-04] 【非遗新魅力】文水：非遗打铁花点亮世泰湖新春夜
[2025-02-04] 上海两大机场迎出境小高峰，跨境短途游火爆
[2025-02-04] 美记：东契奇本预计打火箭复出但他没随队出征客场也没打训练赛

国家发展和改革委员会国务院国有资产监督管理委员会国家能源局国家环保总局中国电力企业联合会中国电机工程学会新华网人民网中国网中国新闻网央视网中青网中国经济网光明网国家电网公司中国南方电网国家电力信息网

指导单位：国家能源局新能源和可再生能源司
国家电网公司农电工作部
中国南方电网有限责任公司农电管理部
主办单位：中国电机工程学会农村电气化专委会
北京国宇出版有限公司
北京通电广告传媒有限公司

联系方式：北京市宣武区白广路北口综合楼　电话：010-63160870
北京二十一世纪炎黄经济信息中心制作维护

QQ群：11321010（已满） 173405694 　122085632
京ICP证060545号京ICP备10019665号

京公网安备 11011502003629号