当前时间:2025-02-02 03:59:05
X

用户名:

密   码:

您现在的位置: 首页 > 新闻速览

新闻速览

张怕芝吃鸡陈寇西13分钟:欧联杯联赛阶段大结局:穆帅极限上岸!直通8队诞生,英超2强领衔

2025-02-02

张怕芝吃鸡陈寇西13分钟

此次蛇年央视春晚的主持依然是三男两女的搭配,有稳重的鲁豫和幽默风趣的撒贝宁、尼格买提三位男主持,还有大气有亲和力的龙洋、甜美可爱的马凡舒两位女主持。,欧联杯联赛阶段大结局:穆帅极限上岸!直通8队诞生,英超2强领衔

张怕芝吃鸡陈寇西13分钟

孟召军致辞

如果全世界都相信这条道路是人工智能的必由之路,那么只要美国控住了英伟达,他们就可以靠控制算力和大模型拿捏世界,就能像上个时代控制石油美元就拿捏全球一样——啥时候不爽了,模型不让你用,芯片不卖给你,正如他们现在对中国做的一切。

zsx256553.jpg

杨振生主持会议

dpj469798.jpg

田鸿斌报告

DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例,Claude 3.5 Sonnet 是一个中等规模的模型,训练成本达 数千万美元,远不是数十亿美元级别。 并且,Claude 3.5 Sonnet 训练于 9-12 个月前,而 DeepSeek 的模型训练于 2023 年 11 月至 12 月,即便如此,Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍,那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。 然而,DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍,这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着,如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍,那其实完全符合正常趋势。 我虽不便给出确切数字,但从前面的分析可以看出,即使接受 DeepSeek 的训练成本数据,他们也只是处于趋势线上,甚至可能还未完全达到。 比如,这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异(10 倍)要小,而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明,DeepSeek-V3 并非独特的突破,也没有从根本上改变 LLM 的经济性,它只是持续成本降低曲线上一个预期的点。 不同的是,这次第一个展示预期成本降低的公司是中国的,这在以往从未有过,具有重大的地缘政治意义。不过,美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低,而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司,但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样,美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek,而是因为它们本就沿着同样的技术路线前进。

gxc873156.jpg

张三弓作报告

从单只产品分红金额来看,有47只公募基金分红超过1亿元,其中,华夏沪深300ETF分红金额达26.83亿元,居于榜首;南方中证500ETF分红金额为15.92亿元,排在第二位;华泰柏瑞红利ETF、华夏鼎丰分红金额超10亿元;南方中证1000ETF、易方达稳健收益B、易方达裕祥回报A、中银睿享定期开放、中银证券汇宇定期开放、中银悦享定期开放分红金额超5亿元。

wni757540.jpg

赵军报告

视频里的他虽然帽子审美遭群嘲,但满面红光的模样倒比前些年显年轻,嗦粉时手舞足蹈的憨态更让网友直呼"有点可爱"。

ufo089636.jpg

王鹏作报告

对内,特朗普推翻了拜登政府的78条“有害政策”;赦免约1500名“国会山骚乱”参与者;终止非法移民子女的出生公民权;只承认男性和女性两种性别;解雇千余名前政府雇员……

zeu462018.jpg

张英豪作报告

及至末节比赛,布伦森率领尼克斯继续压制掘金,他们重新扩大12分领先优势,并且持续维持两位数领先优势。尼克斯最后一节29-26再赢3分,最终尼克斯122-112击败掘金完成赛季横扫。

yfn455334.jpg

傅建国作报告

“我知道他们的能力,所以他们不必在这场比赛中证明自己,但如果他们踢出一场好球,那总是有帮助的,现在最重要的是还有三四个月的时间,他们中的一些人还没有踢过很多比赛。”

lyp212637.jpg

林小军报告

DeepSeek的开发成本与美国企业的大模型相比大幅降低,在于应用了不同的模型训练模式,打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而DeepSeek选择了另外一种方式:利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力,实现了成本的降低和模型性能提升。目前看Meta(脸书母公司)耗费了大量资金训练自己的人工智能模型Llama,但在效果上却没有成本极低的DeepSeek效果好。Meta高层已经在思考其员工是否在浪费公司资金,而这也引发了不少技术人员的恐慌,他们担心自己的技术能力和创新性被质疑,从而失去工作。

lsu213067.jpg

赵志东报告

“我喜欢自己的生活,也喜欢自己的写作。长期以来,它们是在两条线上并行的一种状态。”王计兵说,“现在,这两条线好像合在了一起,形成了一条更加宽阔的道路。但同时,道路无论多么宽阔,它仍然是一条单行道,是我不能回头的一条道路。我应该怎样走好这条路,是我内心所想的一些事情。”

台媒“太报”发表的评论文章却表示,如果真要对台积电与中国台湾的芯片产业动手,特朗普的态度可能一样强硬,马上就要关税大棒攻击。特朗普在上任第一天签署的总统令要求2月1日就开始对墨西哥与加拿大课征25%关税,目前毫无动摇迹象,我们可能在大年初四就要看到美国最近邻的两大贸易伙伴出事,较令人忧虑的是,特朗普的经济智囊先前所发表的理论论述,实际上已经表明,关税大棒对和美国有安全关系的所谓“盟友”最为有效。

斯坦福大学弗里曼·斯波格利国际问题研究所研究员奥丽亚娜・斯凯拉・马斯特罗(Oriana Skylar Mastro)表示,援乌到底能对中国产生多大威慑效果,将取决于美国采取行动的背后逻辑,一些分析人士“过分夸大”了“俄罗斯陷入困境会改变中国”的观点。 更多推荐:张怕芝吃鸡陈寇西13分钟

来源:王建东

标签:欧联杯联赛阶段大结局:穆帅极限上岸!直通8队诞生,英超2强领衔

67.39K

相关报道

指导单位: 国家能源局新能源和可再生能源司
国家电网公司农电工作部
中国南方电网有限责任公司农电管理部
主办单位:中国电机工程学会农村电气化专委会
北京国宇出版有限公司
北京通电广告传媒有限公司

联系方式:北京市宣武区白广路北口综合楼 电话:010-63076930
北京二十一世纪炎黄经济信息中心制作维护
QQ群:11686897(已满) 173633166  122698852
京ICP证060545号 京ICP备10019665号

京公网安备 11011502003629号