果冻精国品入口
不仅仅是DeepSeek一家。其他中国AI模型也凭借有限资源在竞争中占据了一席之地。李开复的初创公司零一万物.AI成立八个月就成为独角兽公司,2024年创造近1400万美元收入,其模型训练成本仅为300万美元,远低于GPT-4的8000万到1亿美元。阿里巴巴的千问也大幅降低了大型语言模型的成本。
当地时间1月27日,美股三大指数收盘涨跌不一,英伟达(Nasdaq:NVDA)股价暴跌16.86%收于每股118.58美元,跌至过去10月以来的最低点;总市值2.90万亿美元,一日蒸发5900亿美元(约合人民币4.28万亿元),创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。,全国流量第一机场易主,抢流量能否换来实际营收?
尽管两家硬盘销售商均声称这些 Exos 硬盘是全新的零售型号,但希捷方面表示,所有四块硬盘实际上均为 OEM(原始设备制造商)型号,这意味着它们并不像普通零售硬盘那样享有五年保修。
DeepSeek的崛起是本次市场动荡的直接导火索。1月27日,由中国大模型公司深度求索开发的移动应用DeepSeek超越ChatGPT登顶苹果美国区免费应用榜单。同日,苹果中国区应用商店的免费榜也显示,DeepSeek为榜单第一,而这背后是近期火遍全球的DeepSeek推出新模型,该模型以极低的成本实现了与OpenAI o1相当的性能,引发市场对科技AI巨头估值的担忧。
那么,是什么让 DeepSeek-R1 如此特别?R1-zero 采用的训练策略证明了仅通过强化学习(RL,Reinforcement Learning),无监督式微调(SFT,Supervised Fine-Tun-ing),大模型也可以有强大的推理能力。Hyperbolic 联合创始人兼 CTO Yuchen Jin 将这一突破与 AlphaGo 进行类比:“就像 AlphaGo 使用纯 RL 下了无数盘围棋并优化其策略以获胜一样,DeepSeek 正在使用相同的方法来提升其能力。2025 年可能会成为 RL 的元年。”
不同开发商的复刻方法不尽相同。针对DeepSeek-R1遗留的特定推理数据收集方法、未公开模型训练代码、训练时的计算和数据缩放定律等问题,Open-R1计划通过以下步骤补齐这些空白板块:
台湾《联合报》26日评论称,翁晓玲有意提案“修宪”,赋予民众直接罢免台湾地区领导人的权利。虽然“修宪”门槛极高,成功几率不大,但这场针对赖清德的罢免议题,势必延烧至其他民意代表,造成更广泛的政治效应。