新闻速览

精产品二区：出新、出圈、出海，为什么又是北京台春晚？

2025-02-03

精产品二区

在他看来，2025年，人工智能的发展可能会进入一个新的阶段，人们将开始真正认同“模型即商品”的理念，即使模型将越来越便宜和可触达。这并不意味着不再投资于模型，而是强调多样性和选择的重要性。特别是中国可能不会再纠结于“本土人工智能落后”的观念，因为前沿模型之间的性能差距正在缩小，使用户在体验上几乎感受不到太大区别。随着模型逐步趋同，人们的关注点将从“谁的模型更强”转向如何更有效地采用和应用这些模型。，出新、出圈、出海，为什么又是北京台春晚？

精产品二区

于洪涛致辞

DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例，Claude 3.5 Sonnet 是一个中等规模的模型，训练成本达数千万美元，远不是数十亿美元级别。并且，Claude 3.5 Sonnet 训练于 9-12 个月前，而 DeepSeek 的模型训练于 2023 年 11 月至 12 月，即便如此，Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍，那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。然而，DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍，这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着，如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍，那其实完全符合正常趋势。我虽不便给出确切数字，但从前面的分析可以看出，即使接受 DeepSeek 的训练成本数据，他们也只是处于趋势线上，甚至可能还未完全达到。比如，这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异（10 倍）要小，而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明，DeepSeek-V3 并非独特的突破，也没有从根本上改变 LLM 的经济性，它只是持续成本降低曲线上一个预期的点。不同的是，这次第一个展示预期成本降低的公司是中国的，这在以往从未有过，具有重大的地缘政治意义。不过，美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低，而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司，但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样，美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek，而是因为它们本就沿着同样的技术路线前进。

闫海修主持会议

杨汉强报告

张全全的父亲是老家的县长，按理来讲，在城里办了婚礼后本就应该第一时间回老家办婚礼，毕竟人家父亲也是要面子的不是吗？但邱华一忙起来就啥都忘记了，完全只记得她的当事人和自己的工作了，而张全全只能一次又一次的拒绝父母回老家办婚礼的要求。

孙彦敏作报告

对外，特朗普实行“美国优先”外交和贸易政策；继续“退群”，宣布退出《巴黎协定》和世界卫生组织；宣布美墨边境进入国家紧急状态；将墨西哥湾更名为“美国湾”；给予TikTok“不卖就禁”法案75天宽限期；同时威胁对中国等其他国家加征关税……

陈景芝报告

在丰台区，丰台区消防救援支队防火监督员发现丽源路附近的一家菜市场内，一家主食档口全是面粉粉尘。“您这属于高粉尘浓度环境，电线接口这里必须加装塑料外壳，一旦短路打火有可能发生爆燃。”防火监督员对市场经营者进行约谈，并要求该店主立即整改。

冯留启作报告

女性在不同的年龄阶段，她们添置的衣服可能会有很明显的不同。到了40岁之后，大多数的女性都会追求有质感的着装，让自己的形象和气质更好一些。

张宁作报告

而他所谓的“窃取”，实际上是DeepSeek-R1在训练过程中进行的“模型蒸馏”技术。这是一种在资源受限场景中常用的技术，具有降低计算成本、提升推理速度等优势，在多个领域都有广泛的应用场景。

崔小尚作报告

宋养琰一直记挂着家乡大柳巷，退休以后，时常会回到家乡看看。宿迁文明网发布的信息显示，大柳巷原属四河乡，由迎淮、淮建、新淮3个行政村组成，总长约5公里。2020年行政区域规划调整，撤销原来的双沟镇、四河乡、峰山乡，成立新的双沟镇。

任丽红报告

奥特曼在回答是否会公开一些大模型权重的问题时说，“我个人认为在（开闭源）这个问题上我们站在了历史的错误一方，需要找出一个不同的开源策略。不过不是所有OpenAI的人都同意这个观点，而且目前这也不是我们最高优先级。”

李进锋报告

从此，詹眉组合成为了过去式，詹姆斯将会在之后联手东契奇。湖人队将会以詹姆斯和东契奇两大超巨为班底，继续组建球队。这笔交易，对于独行侠和湖人来说，是赢是输，目前还不得而知。但是，对于喜欢浓眉的球迷们来说，今天无疑是一个令人感到伤感的日子。祝浓眉在独行侠，未来一切皆好！

紧接着，萨克斯又将矛头对准刚刚离任的拜登政府，指责其任内在美国人工智能公司中推广“多元、公平及包容”计划（DEI），导致这些企业浪费了许多本该用于研发的精力。

当然，一旦速度变得更快，打个比方这就意味着别人家的模型要训练十天，而 DeepSeek 只需要训练五天，那么就能给模型喂更多的数据，即能让模型在同等时间内看到更多的数据，间接提高模型的效果。更多推荐：精产品二区

来源：苏子红

标签：出新、出圈、出海，为什么又是北京台春晚？

相关报道

[2025-02-03] 2~3月想买全新SUV？建议认准这4款，都是精品车型
[2025-02-03] 斯诺克德国大师赛：张安达2-5遭麦克吉尔逆转，无缘晋级8强
[2025-02-03] 网友在航班座位下捡到鞭炮？桂林两江国际机场：正在核实调查
[2025-02-03] “职业打手”下场！DeepSeek遭攻击烈度暴增百倍
[2025-02-03] 攒了一整年，是时候把这篇发出来了！
[2025-02-03] 李亚鹏婚后首陪老婆回娘家过年，路边摊吃粉，头上“乞丐帽”抢镜
[2025-02-03] (新春走基层）科技庙会在京举办 AI“洞悉”新年俗潮流
[2025-02-03] 新西兰网友大年初三咖啡馆偶遇马云
[2025-02-03] 有钱都买不到电影票，电影抢票堪比春运咋回事？
[2025-02-03] 看完封神2，更期待3了

国家发展和改革委员会国务院国有资产监督管理委员会国家能源局国家环保总局中国电力企业联合会中国电机工程学会新华网人民网中国网中国新闻网央视网中青网中国经济网光明网国家电网公司中国南方电网国家电力信息网

指导单位：国家能源局新能源和可再生能源司
国家电网公司农电工作部
中国南方电网有限责任公司农电管理部
主办单位：中国电机工程学会农村电气化专委会
北京国宇出版有限公司
北京通电广告传媒有限公司

联系方式：北京市宣武区白广路北口综合楼　电话：010-63335326
北京二十一世纪炎黄经济信息中心制作维护

QQ群：11580180（已满） 173960924 　122175594
京ICP证060545号京ICP备10019665号

京公网安备 11011502003629号