-
最近,通义千问实火。前段时间被网友玩疯的全民舞王,让「AI科目三」频频登上热搜。让甄嬛、慈禧、马斯克、猫主子和兵马俑能跳舞那款AI,就藏在通义千问APP背后。来源:深夜来点薯片来源:深夜来点薯片最强国产视觉语言模型了解一下就在这几天,通义千问团队又对多模态大模型下
-
「大模型的 API 是个亏本买卖吗?」随着大语言模型技术的逐渐实用化,越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」,我们也有理由怀疑以大模型为基础的业务到底能不能持续。本周四,AI 创业公司 Martian
-
近日,作为美国前十的科技博客,Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。在NeurIPS会议总共接受的3586篇论文之中,除去6篇获奖论文,其他论文也同样优秀和具有潜力,甚至有可能预示着下一个AI领域的新突破。那就让我们
-
2023 年,Transformer 在 AI 大模型领域的统治地位被撼动了。发起挑战的新架构名叫「Mamba」,它是一种选择性状态空间模型( selective state space model),在语言建模方面可以媲美甚至击败 Transformer。而且,
-
去年12月,CMU和普林斯顿的2位研究者发布了Mamba架构,瞬间引起AI社区震动!结果,这篇被众人看好有望「颠覆Transformer霸权」的论文,今天竟曝出疑似被顶会拒收?!今早,康奈尔大学副教授Sasha Rush最先发现,这篇有望成为奠基之作的论文似乎要被
-
GPT-4又双叒叕变强了!今天,OpenAI正式发布了更新版的GPT-4 Turbo——gpt-4-0125-preview。不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。与此同时,OpenAI还发布了一系列模型和API更新,总体来说就是「更