硅基茶馆——关于AI的唠嗑扯闲篇

哈人,这么高的成本真的有什么使用的价值吗?

当然是直接调api的情况,不过即使是订阅了 claude max 什么的,也只是这两周限时可用,之后都得调api。

看评价是说什么 gpt5.5 xhigh 跑几天解决不了的问题,fable 一轮就解决了。不过也正常,智力提升了嘛。

ultracode 这个比之前的 agent team 要实际一点,之前的 agent team 感觉纯噱头,实际用起来一堆问题。比如agent之间为啥要多轮对话

2 个赞

感觉有点贵了

2 个赞

多尝试吧,也没啥,现在AI除了coding外确实还没找到规模化付费场景,只能摸索

5 个赞

不是,标准版连续包月都要68啊?和他模型性能完全不匹配啊

1 个赞

唯一合理的解释是模型能力会有很大提升,甚至接近gpt的水平,不然很难想象这玩意有谁付费

1 个赞

今天刚吃到小红书的瓜,有某公司的新模型测试分数上很高但是内部实测拉跨的一批,现在在问怎么甩锅…我很怀疑豆包最多就是分数上追平GPT

12 个赞

音符刷到fable能直接生成大型游戏项目,我看到的是老滚like,UI、人物、场景等美术资产全是生成的,和原版老滚很像,真这么吊吗 :thinking:

1 个赞

老师们有用过bolt.new吗,可以快速生成应用和网页的,尝试了下免费token还给的蛮多的

不懂ai
但是fable是这个吗

假的,fable5又不是3D模型

5 个赞


小红书在上传skills功能后新的动作,上线vibe coding,但是先上线的是上传功能,开发功能排期还在后面

2 个赞

Gemmna 家族有了新成员 ——DiffusionGemma,一个探索文本扩散的实验性开源模型,在文本生成任务上速度极快。
根据官方介绍,DiffusionGemma 采用了 Apache 2.0 许可证发布,是一个 26B 规模的混合专家模型(MoE)。
该模型没有沿用典型自回归大语言模型(LLM)那种按顺序、逐 token 生成的方式,而是可以同时生成整块文本,在 GPU 上,文本生成速度最高可提升至 4 倍。
信息源:https://mp.weixin.qq.com/s/Qf8788wjPUzs7s__hBBRkw
目前自回归模型已经逐渐摸到瓶颈,扩散模型的研究又迎来了关注。

1 个赞


A社对于fable5逆天的安全检测以及悄咪换模型的事情道歉,但不改,“触发换模型会发送通知”

虽然但是字节在模型上好像不注重测评吧?每个模型测评视频我就没见过有几个拉豆包玩的。。

字节内部看不看重我不知道,我只是吃到了瓜(公司正主不明)然后自己推测而已,至于模型测评视频不带豆包玩有没有可能是豆包本身就不大好,拉过来测也没多少流量

4 个赞

LPM的会改到明天11:10了

3 个赞

假的,音符上一堆分不清chatgpt和GPT的人,还有人狂吹claude code吊打chatgpt的,而且claude模型一直是coding强,多模和美术素材生成claude做不来的。

1 个赞

diffusion近几年一直统治图像和视频生成领域,理论上确实也可以用来做文本生成,但和现有LLM架构比算力成本高太多了很难往超大文本超长记忆生成去做,至于谷歌这个工作其实偏探索性质(灌水),影响力有限。

3 个赞

高强度使用了一周kimi work,我感觉月之暗面的产品确实做的不错:blush:达不到codex水平,但是作为一个开箱即用的助手类agent非常适合新手。他这个work模式不知道是,优化了token消耗,还是月之暗面为了推广做了补贴,反正token使用比kimi code少了好多。周末休息去试试字节trae的类codex产品。我估计豆包付费版就是卖codex产品的额度会员,就算模型能力不强,体验做好的话还挺符合豆包的产品调性的。国内类codex产品应该就这两个吧,不得不说openai这公司产品能力还厉害,a■模型能力再厉害价值也就到专业用户这块了。

4 个赞