In an interview with Xinhua, Sabrina Ionescu, Olympics gold medalist and WNBA star, shared her passion for sports and her perspective on female strength.
人工智能技术的迅猛发展在全球范围内引发大语言模型(Large Language Model, ...
王鑫涛,复旦大学博士生,师从肖仰华、汪卫教授,致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术,在AI角色扮演领域发表多篇ACL/EMNLP论文,以及该领域首篇研究综述,总计引用量三百余次。他的研究寻求AI技术与人类情感 ...
Scaling Law 由 OpenAI 团队于 2020 年正式提出,并在其论文《神经语言模型的扩展定律》(Scaling Laws for Neural Language Models)中进行了详细阐述。Scaling Law ...
长文本任务是当下大模型研究的重点之一。在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的 长程依赖关系 ...
著名评论家玛乔瑞·珀洛夫在《O与绿色》的护封上写道:“被声音和遥远的气息所洗涤”,保罗·胡佛的非凡诗篇总是为我们呈现出令人惊叹的声音干预和“遥远世界”的气息与新的可能性。他那简洁、密集的诗行,通常以三行形式排列,比我见过的任何其他抒情诗更能延续威廉斯 ...
谷歌本次发布的Gemma 3有四个版本,最小的版本有10亿个参数,最大的版本有270亿个参数——但这也算是一个相当“瘦身”的AI大模型了。谷歌公司称,Gemma 3是该公司迄今为止开发的“最先进、最好用而且开发得最负责的一款开源大模型。” ...
研究人员发现随着模型尺寸的增大,DiLoCo 会呈现出可预测的稳健扩展。如果调整得当,DiLoCo 的模型规模扩展性优于数据并行训练方法,即使在小模型规模下 DiLoCo 也能胜过数据并行训练方法。
目前,离散扩散模型目前面临至少三个限制。首先,在聊天系统等应用中,模型必须生成任意长度的输出序列(例如对用户问题的回答)。但是,大多数最新的扩散架构仅能生成固定长度的向量。其次,离散扩散模型在生成过程中使用双向上下文,因此无法使用 KV ...
10 小时
金融界汽车 on MSN汽车行业观察:智元灵犀X2与GO-1大模型突破通用性;Figure BotQ加速 ...近期,机器人领域迎来多项技术突破与商业化进展。北京人形机器人创新中心发布首个“一脑多能”的通用具身智能平台“慧思开物”,智元机器人推出新一代人形机器人“灵犀X2”及基座大模型GO-1,进一步推动机器人通用性提升。与此同时,Figure公司推出首条自主 ...
Efimova Alina来自俄罗斯,汉语的魅力吸引着她来到了中国。为了学习中文,她踏上了求学之旅,却意外爱上了长沙这片热土。她称这里是“最懂她的城市”,能支持她找到自己想要的生活。今年是她在长沙求学的第六个年头,她即将从中南大学数字媒体设计专业毕业。如今,她说着一口流利的中文,在长沙完成了学业、学会了书法,还在这里找到了真爱,于是她决定留在这里,让长沙成为自己的家。
22 小时on MSN
3 月 7 日晚,智元机器人联合创始人「稚晖君」(彭志辉)在微博上扔下了一颗「预告炸弹」——「下周有好东西发布」。短短一句话,迅速引爆全网,阅读量飙升至 10 万+。 结果,3 月 10 日上午,智元机器人就揭晓了谜底——Genie Operator ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果