当前时间:2025-02-04 04:03:00
X

用户名:

密   码:

您现在的位置: 首页 > 新闻速览

新闻速览

婷婷六月天:Meta首席科学家杨立昆吐槽硅谷“常见病”:错位的优越感情节

2025-02-04

婷婷六月天

DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例,Claude 3.5 Sonnet 是一个中等规模的模型,训练成本达 数千万美元,远不是数十亿美元级别。 并且,Claude 3.5 Sonnet 训练于 9-12 个月前,而 DeepSeek 的模型训练于 2023 年 11 月至 12 月,即便如此,Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍,那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。 然而,DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍,这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着,如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍,那其实完全符合正常趋势。 我虽不便给出确切数字,但从前面的分析可以看出,即使接受 DeepSeek 的训练成本数据,他们也只是处于趋势线上,甚至可能还未完全达到。 比如,这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异(10 倍)要小,而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明,DeepSeek-V3 并非独特的突破,也没有从根本上改变 LLM 的经济性,它只是持续成本降低曲线上一个预期的点。 不同的是,这次第一个展示预期成本降低的公司是中国的,这在以往从未有过,具有重大的地缘政治意义。不过,美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低,而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司,但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样,美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek,而是因为它们本就沿着同样的技术路线前进。,Meta首席科学家杨立昆吐槽硅谷“常见病”:错位的优越感情节

婷婷六月天

王晖致辞

在杨千幻和老何决定为自己而活的那一刻,我看到了他们身上光环在闪闪发光。是吧,对于我们这些平凡的人而言,也有那么一刻,是在闪光的吧。那是我们反抗命运的一刻,那是我们拒绝放弃的一刻。

ndp423075.jpg

李清良主持会议

fbt696360.jpg

苏有成报告

其实大S状态显然经不起折腾,早期患有癫痫,需要长期服药,而且为了美貌和减肥,早期尝试了各种方法,包括打凝血剂,还要吃思诺思,而这个药物是抑郁症患者助眠使用。可见大S身体有多糟糕,汪小菲就爆料过,大S几次精神出状况,他都在旁抢救过。

slt071770.jpg

牟永英作报告

1993年正好艺校在招生,他听取了朋友的建议准备去试一试报考解放军艺术学院,凭借着出众的外形和优异的成绩,他成功考取了该学校,与后来名声大噪的闫妮成为同班同学。

cdr877591.jpg

张晓宇报告

流感疫苗接种后,通常要2~4周才能产生具有保护水平的抗体。因此,一般推荐在冬季流感流行以前进行疫苗接种,多数在9~10月份。当然,过了这个时间也可以接种。

yvb152242.jpg

孙孟勇作报告

“我们正在整个技术领域进行创新,帮助客户充分发挥AI的投资回报,抓住未来的巨大机遇。我们的AI业务年收入已超过130亿美元,同比增长175%。”CEO:DeepSeek有“真正的创新” 成本下降会让AI更普遍 对微软是好消息

ctt894292.jpg

冯奎青作报告

直播吧2月2日讯 据此前Shams报道,东契奇+克莱伯+莫里斯去湖人,独行侠换来浓眉+克里斯蒂+2029年首轮!这是一笔三方交易,还涉及到爵士。

djq751498.jpg

李天军作报告

然而,2023年8月,安石海涂堤坝突然被冲溃,560多公顷海涂区域被淹,包括270多公顷稻田。官方将此定性为“严重灾害”。金正恩亲自到现场视察,将受灾原因归结为“干部们不担当、不作为”。从时任内阁总理金德训到“省和中央一级机关负责干部”,再到基层部门负责人,都被斥为“简直是一群坏蛋、肇事者”。

pcc406673.jpg

任清报告

在发布前,OpenAI采用了全面的安全准备、外部红队测试和多种安全评估方法,对o3-mini的风险进行了严格评估。相关的详细评估结果和风险防控措施,均记录在o3-mini的系统卡中。

zzo661410.jpg

田静慧报告

在双核表现不佳的情况下,尼克斯能够在主场和湖人鏖战至最后一刻,战旧主的功不可没,凭借16中11的高效率,怒砍26分、13个篮板、11次助攻和2次抢断的三双数据,可惜队友不给力,让哈特的华丽数据成为了无用功。

随着2025年临近,五粮液、剑南春、泸州老窖、贵州习酒、今世缘等酒企在淘宝、京东、抖音等平台通过会员满赠、秒杀单品、搭配礼盒等方式吸引消费者。

2025年央视春晚结束之后,网络上对每个节目进行了打分,下面就简单盘点一下分数最高的十个节目,看看哪一个更受观众喜欢。 更多推荐:婷婷六月天

来源:周昌树

标签:Meta首席科学家杨立昆吐槽硅谷“常见病”:错位的优越感情节

67.87K

相关报道

指导单位: 国家能源局新能源和可再生能源司
国家电网公司农电工作部
中国南方电网有限责任公司农电管理部
主办单位:中国电机工程学会农村电气化专委会
北京国宇出版有限公司
北京通电广告传媒有限公司

联系方式:北京市宣武区白广路北口综合楼 电话:010-63535769
北京二十一世纪炎黄经济信息中心制作维护
QQ群:11949479(已满) 173654894  122744302
京ICP证060545号 京ICP备10019665号

京公网安备 11011502003629号