当前位置:数智频道首页 > 人工智能 > 正文

瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus

瑞士正式发布了国家级开源大语言模型Apertus,旨在成为OpenAI等企业所提供模型的替代选择。Apertus这个名字来源于拉丁语,意为“开放”。该模型由瑞士洛桑联邦理工学院、苏黎世联邦理工学院以及瑞士国家超级计算中心联合研发,这三家机构均为公共机构。

瑞士加入全球 AI 竞赛,推出国家级开源大语言模型 Apertus

推动AI成为公共基础设施的核心倡导者约书亚・谭表示,Apertus是领先的公共AI模型,由公立机构打造,服务于公共利益。他认为,AI完全可以成为像公路、供水、供电一样的公共基础设施。瑞士研发团队将Apertus设计为完全开源模式,用户可以查看其训练过程的各个环节。除了模型本身外,团队还公开了训练过程的完整文档、源代码以及所使用的数据集。Apertus的研发严格遵循瑞士数据保护法与版权法,对于希望遵守欧洲相关法规的企业来说,它可能是更优的选择之一。瑞士银行家协会曾指出,本土研发的大语言模型具有巨大的长期潜力,因为这类模型能更好地契合瑞士严格的本地数据保护法规与银行保密制度。目前,瑞士各银行已在使用其他AI模型满足业务需求,未来是否会转向Apertus,仍有待观察。

Apertus向所有用户开放使用,科研人员、AI爱好者乃至企业都可以基于该模型进行二次开发,根据自身需求定制功能。例如,用户可以借助它开发聊天机器人、翻译工具,甚至是教育或培训类应用。Apertus的训练数据涵盖1000多种语言,总token量达15万亿,其中非英语数据占比40%,包括瑞士德语、罗曼什语等瑞士本土语言。瑞士官方声明称,该模型的训练仅使用公开可获取的数据,且其数据爬虫在网站上遇到机器可读的“拒绝爬取”请求时会予以尊重。需要注意的是,此前已有Perplexity等AI企业被指控爬取网站数据并绕过用于阻止爬虫的协议;部分AI企业还因未经许可使用新闻机构及创作者的内容训练模型而面临法律诉讼。

目前,Apertus提供两种参数规模的版本,分别为80亿参数与700亿参数。用户可以通过瑞士电信或AI平台Hugging Face获取该模型。

热点推送

本周关注

MORE