新闻速览

国精产品自偷自偷学吉他：违规委托个人招揽投资者，光大证券营业部员工收警示函

2025-02-01

国精产品自偷自偷学吉他

此外，网友“momo”发帖询问：“谁来解密一下，是不是那三本书里的所有字，各三个排列都能写成‘蛇’啊？”在这个帖子的回复区，网友“Postrocker”回复称：“双页纸，不管停到哪页，撕下来的都是那三个字。”，违规委托个人招揽投资者，光大证券营业部员工收警示函

国精产品自偷自偷学吉他

魏永安致辞

DeepSeek 并没有“用 600 万美元做到美国 AI 公司花费数十亿美元才能实现的事情”。以 Anthropic 为例，Claude 3.5 Sonnet 是一个中等规模的模型，训练成本达数千万美元，远不是数十亿美元级别。并且，Claude 3.5 Sonnet 训练于 9-12 个月前，而 DeepSeek 的模型训练于 2023 年 11 月至 12 月，即便如此，Claude 3.5 Sonnet 在多个关键评估中仍明显领先。 DeepSeek 的训练成本并未突破行业趋势。如果成本曲线下降的历史趋势是每年约 4 倍，那么按照正常业务发展——即 2023 年和 2024 年的成本下降趋势——我们现在应该会看到一个比 3.5 Sonnet/GPT-4 便宜 3 到 4 倍的模型。然而，DeepSeek-V3 的性能比这些美国前沿模型差一些——假设在扩展曲线上差约 2 倍，这已经是对 DeepSeek-V3 相当慷慨的估计了——这意味着，如果 DeepSeek-V3 的训练成本比一年前开发的美国当前模型低约 8 倍，那其实完全符合正常趋势。我虽不便给出确切数字，但从前面的分析可以看出，即使接受 DeepSeek 的训练成本数据，他们也只是处于趋势线上，甚至可能还未完全达到。比如，这比原始 GPT-4 到 Claude 3.5 Sonnet 的推理价格差异（10 倍）要小，而且 3.5 Sonnet 本身也是一个比 GPT-4 更好的模型。这些都表明，DeepSeek-V3 并非独特的突破，也没有从根本上改变 LLM 的经济性，它只是持续成本降低曲线上一个预期的点。不同的是，这次第一个展示预期成本降低的公司是中国的，这在以往从未有过，具有重大的地缘政治意义。不过，美国公司很快也会跟上这一趋势——他们不会通过抄袭 DeepSeek 来实现成本降低，而是因为他们自身也在沿着常规的成本降低趋势发展。 DeepSeek 不是第一个实现成本优化的公司，但它是第一个来自中国的公司。这一点在地缘政治上意义重大。但同样，美国 AI 公司也会很快跟进——并不是通过抄袭 DeepSeek，而是因为它们本就沿着同样的技术路线前进。

仝峰主持会议

马根源报告

这些结核主要分布在克拉里昂-克利珀顿区（CC区），中国已在该区域承包了6.3万平方公里的勘探权。多金属结核的开采不仅能够满足中国对关键金属的需求，还能为高科技产业的发展提供重要原材料，其经济价值不言而喻。

张志作报告

如今在这个迎婿日，赵丽颖和冯绍峰也同时更新了动态，送上了新春祝福，这也给人一种依旧默契的感觉。不知道他们是否相伴回赵丽颖的娘家，一起给爷爷发红包呢？可不管怎样，如果两人能够早日官宣更多好消息的话，相信也会赢得大家广泛祝福的，而最开心的应该是他们的儿子“想想”了！

刘晓东报告

李卓群很期待用戏曲带给自己的养分，去和更多行业的创作者和受众们交流，也希望通过更多优秀的舞台作品，将这束戏曲之光推向更广阔的国际舞台。就像一粒埋在传统土壤中的种子，在她坚定的初心上生长出无尽茂盛的枝叶。而这朵花，盛开在舞台之上，也绽放在每一个热爱戏曲者的灵魂深处。

段玉艳作报告

华尔街见闻本周稍早指出，投资者一直对AI公司声称需要巨额资金训练模型持谨慎态度，尤其是在缺乏短期盈利计划的情况下。DeepSeek的突然走红似乎坐实了这种担忧。尤其是，DeepSeek称其AI模型的性能可与OpenAI的媲美，开发成本却仅相当于OpenAI的极小部分，引发了投资者对AI企业高额投入是否合理的质疑。

张洪波作报告

在智能水平与o1相当的前提下，o3-mini提供了更快的性能和更高的效率。除了上述提及的STEM评估之外，采用中等推理努力的情况下，o3-mini在数学和事实性评估中也展现出更出色的表现。在A/B测试中，o3-mini的响应速度比o1-mini快24%，其平均响应时间为7.7秒，而o1-mini为10.16秒。延迟方面，o3-mini的首个token平均比o1-mini快2500毫秒。