苹果推出新开源AI模型对抗Meta——为何重要?

发布日期:2024-10-01 15:13

来源类型:西安发布 | 作者:卢杉

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【新澳门免费资料】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【澳彩正版资料长期免费公开吗】【2O24澳彩管家婆资料传真】
【494949澳门今晚开什么】 【2024新澳免费资料】 【新澳门资料大全正版资料2024年免费下载】

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!

苹果正在迅速成为开源人工智能运动的领军者之一,推出了一种新的7B参数模型,任何人都可以使用或改编。由苹果研究部门开发的新模型不太可能成为苹果产品的一部分,但其训练过程中学到的经验教训可能会应用其中。这是iPhone制造商致力于通过开放数据倡议建立更广泛的AI生态系统的一部分。

这是DCLM模型家族的最新版本,在基准测试中表现优于Mistral-7B,接近Meta和谷歌的同类模型。苹果的机器学习团队成员Vaishaal Shanker在X平台上写道,它们是“目前性能最好的真正开源模型”。真正开源意味着所有权重、训练代码和数据集都是公开的。

这与Meta计划发布其GPT-4竞争对手Llama 3 400B的同一周。尚不清楚苹果是否计划将来发布更大的DCLM模型。

苹果新模型的细节:

苹果的DCML(数据压缩语言模型)项目包括来自苹果、华盛顿大学、特拉维夫大学和丰田研究所的研究人员,旨在设计高质量的数据集用于训练模型。考虑到最近对某些模型训练数据的担忧,这是一项重要举措。团队在相同的模型架构、训练代码、评估和框架下进行不同的实验,以找到最优的数据策略,从而创建高性能且高效的模型。

新模型的特点:

这个模型不仅非常高效,还完全开源。7B模型与同尺寸的其他模型性能相当,但训练所用的内容token数量更少。虽然其2,000 token的上下文窗口较小,无法用于大型文本摘要,但在标准评估基准测试中具有63.7%的5-shot准确率。尽管其尺寸和上下文窗口较小,所有权重、训练数据和过程的开源使其成为今年最重要的AI发布之一。这将使研究人员甚至公司更容易创建自己的小型AI,并可嵌入研究项目或应用中使用,无需按token付费。

OpenAI的CEO Sam Altman上周发布的小型GPT-4o mini时表示,目标是创造“太便宜以至于无法计量”的智能——苹果的项目也是这种理想的一部分。

关注公众号【真智AI】

TOP AI模型智能问答|绘图|识图|文件分析

每天分享AI教程、赚钱技巧和前沿资讯!返回搜狐,查看更多

责任编辑:

布莱恩·考辛斯:

8秒前:每天分享AI教程、赚钱技巧和前沿资讯!

姜蕾:

5秒前:TOP AI模型智能问答|绘图|识图|文件分析

雷吉尔·库迪乌:

8秒前:新模型的特点:

王冰阳:

1秒前:7%的5-shot准确率。