人工智能技术的迅猛发展在全球范围内引发大语言模型(Large Language Model, ...
王鑫涛,复旦大学博士生,师从肖仰华、汪卫教授,致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术,在AI角色扮演领域发表多篇ACL/EMNLP论文,以及该领域首篇研究综述,总计引用量三百余次。他的研究寻求AI技术与人类情感 ...
长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的 长程依赖关系 ...
Scaling Law 由 OpenAI 团队于 2020 年正式提出,并在其论文《神经语言模型的扩展定律》(Scaling Laws for Neural Language Models)中进行了详细阐述。Scaling Law ...
著名评论家玛乔瑞·珀洛夫在《O与绿色》的护封上写道:“被声音和遥远的气息所洗涤”,保罗·胡佛的非凡诗篇总是为我们呈现出令人惊叹的声音干预和“遥远世界”的气息与新的可能性。他那简洁、密集的诗行,通常以三行形式排列,比我见过的任何其他抒情诗更能延续威廉斯 ...
人类一直梦想着能够的直接通过思想与机器沟通。在科幻电影《黑客帝国》中,人类通过脑机接口直接将意识上传至数字世界;《三体》中的“思想钢印”则通过脑电波操控人类信念。如今,这些幻想正在被人工智能大模型逐步解构为现实。一场关于“读心术”的科技革命正在悄然展 ...
目前,离散扩散模型目前面临至少三个限制。首先,在聊天系统等应用中,模型必须生成任意长度的输出序列(例如对用户问题的回答)。但是,大多数最新的扩散架构仅能生成固定长度的向量。其次,离散扩散模型在生成过程中使用双向上下文,因此无法使用 KV ...
9 小时
金融界汽车 on MSN汽车行业观察:智元灵犀X2与GO-1大模型突破通用性;Figure BotQ加速 ...近期,机器人领域迎来多项技术突破与商业化进展。北京人形机器人创新中心发布首个“一脑多能”的通用具身智能平台“慧思开物”,智元机器人推出新一代人形机器人“灵犀X2”及基座大模型GO-1,进一步推动机器人通用性提升。与此同时,Figure公司推出首条自主 ...
Efimova Alina来自俄罗斯,汉语的魅力吸引着她来到了中国。为了学习中文,她踏上了求学之旅,却意外爱上了长沙这片热土。她称这里是“最懂她的城市”,能支持她找到自己想要的生活。今年是她在长沙求学的第六个年头,她即将从中南大学数字媒体设计专业毕业。如今,她说着一口流利的中文,在长沙完成了学业、学会了书法,还在这里找到了真爱,于是她决定留在这里,让长沙成为自己的家。
21 小时on MSN
3 月 7 日晚,智元机器人联合创始人「稚晖君」(彭志辉)在微博上扔下了一颗「预告炸弹」——「下周有好东西发布」。短短一句话,迅速引爆全网,阅读量飙升至 10 万+。 结果,3 月 10 日上午,智元机器人就揭晓了谜底——Genie Operator ...
英伟达GTC:当地时间3月17日至21日,英伟达即将在美举办全球AI界顶级峰会——GTC2025,北京时间3月19日凌晨,黄仁勋将发表主题演讲,主题将锁定AI智能体、机器人技术,以及加速运算的未来发展。核心看好架构升级和供应链优化:1、GB300和B300即将发布,B300性能或较B200提升50%。1)HBM:B300系列预计将提供更高的计算性能和8组12-HiHBM3E内存,提供高达288GB ...
19 小时
什么值得买社区频道 on MSN大厂都在用的秘密武器:永久Pro版神器,快冲!小伙伴们,今天要给大家安利两款超实用的工具,绝对能帮你解决不少烦恼!第一款:FontExpert 设计师小伙伴们是不是经常为了字体管理头疼?字体库庞 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果