苹果推出新开源AI模型对抗Meta——为何重要？

发布日期：2024-10-01 15:13

来源类型：西安发布 | 作者：卢杉

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【新澳门免费资料】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【澳彩正版资料长期免费公开吗】【2O24澳彩管家婆资料传真】

【494949澳门今晚开什么】【2024新澳免费资料】 【新澳门资料大全正版资料2024年免费下载】

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯！

苹果正在迅速成为开源人工智能运动的领军者之一，推出了一种新的7B参数模型，任何人都可以使用或改编。由苹果研究部门开发的新模型不太可能成为苹果产品的一部分，但其训练过程中学到的经验教训可能会应用其中。这是iPhone制造商致力于通过开放数据倡议建立更广泛的AI生态系统的一部分。

这是DCLM模型家族的最新版本，在基准测试中表现优于Mistral-7B，接近Meta和谷歌的同类模型。苹果的机器学习团队成员Vaishaal Shanker在X平台上写道，它们是“目前性能最好的真正开源模型”。真正开源意味着所有权重、训练代码和数据集都是公开的。

这与Meta计划发布其GPT-4竞争对手Llama 3 400B的同一周。尚不清楚苹果是否计划将来发布更大的DCLM模型。

苹果新模型的细节：

苹果的DCML（数据压缩语言模型）项目包括来自苹果、华盛顿大学、特拉维夫大学和丰田研究所的研究人员，旨在设计高质量的数据集用于训练模型。考虑到最近对某些模型训练数据的担忧，这是一项重要举措。团队在相同的模型架构、训练代码、评估和框架下进行不同的实验，以找到最优的数据策略，从而创建高性能且高效的模型。

新模型的特点：

这个模型不仅非常高效，还完全开源。7B模型与同尺寸的其他模型性能相当，但训练所用的内容token数量更少。虽然其2,000 token的上下文窗口较小，无法用于大型文本摘要，但在标准评估基准测试中具有63.7%的5-shot准确率。尽管其尺寸和上下文窗口较小，所有权重、训练数据和过程的开源使其成为今年最重要的AI发布之一。这将使研究人员甚至公司更容易创建自己的小型AI，并可嵌入研究项目或应用中使用，无需按token付费。

OpenAI的CEO Sam Altman上周发布的小型GPT-4o mini时表示，目标是创造“太便宜以至于无法计量”的智能——苹果的项目也是这种理想的一部分。

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯！返回搜狐，查看更多

责任编辑：

布莱恩·考辛斯：

8秒前：每天分享AI教程、赚钱技巧和前沿资讯！

姜蕾：

5秒前：TOP AI模型智能问答|绘图|识图|文件分析

雷吉尔·库迪乌：

8秒前：新模型的特点：

王冰阳：

1秒前：7%的5-shot准确率。

西安发布

中国科学家在月壤中发现量产水的方法；“英国版比尔·盖茨”确认遇难

翻台率达42次天，海底捞上半年核心经营利润近28亿元

当前智能汽车与传统汽车有本质区别了吗？

贵州小伙龙道一奥运夺冠家乡的小院沸腾了妈妈回来给你做好吃的

苹果推出新开源AI模型对抗Meta——为何重要？

苹果推出新开源AI模型对抗Meta——为何重要？

推荐文章