近十年间,开源对 AI 的发展起到极大推动作用,然而 AI 应用始终是全行业的“阿喀琉斯之踵”。对于大多数工程师而言,AI 模型存在高使用门槛、部署难度大等难题,无法释放 AI 应用更多潜能。在不断探索中,一种服务 AI 开发者的新模式逐渐显露,模型即服务(Model as a )因大幅简化模型应用门槛备受欢迎。
这次,中国的AI 模型社区终于来了。
11 月 3 日,2022 云栖大会杭州现场,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”,旨在打造下一代开源的模型即服务共享平台,致力降低 AI 应用门槛。首批合作机构还包括澜舟科技、智谱AI、深势科技、哈工大讯飞联合实验室、中国科学技术大学等。
阿里巴巴集团资深副总裁、达摩院副院长周靖人表示,AI 模型较为复杂,尤其是要应用于行业场景,往往需要重新训练,这使得 AI 只掌握在少数算法人员手中,难以走向大众化。而新推出的 魔搭社区提供众多预训练基础模型,只需针对具体场景再稍作调优,就能快速投入使用。
据介绍,社区首批上架超 300 个模型,其中中文模型超过 100 个,覆盖了视觉、语音、自然语言处理、多模态等 AI 主要领域,覆盖主流任务超过 60 个。上架模型均经过专家筛选和效果验证,包括150 多个 SOTA 模型和十多个大模型,已开全面开源并开放使用,开发者可在平台上免费体验与下载使用。
AI 之前的使用大多以付费 API 提供,魔搭社区不仅提供了免费的 API,而且提供的是可编程的 API 接口社区50个创新小项目,输出的不再是固定结果,而是结构化的数据,以便开发者能二次开发。同时,社区提供的模型结合领域数据集,提供了二次开发的定制化能力,为模型在不同具体使用场景上使用提供了可能。
由于魔搭社区不仅提供开源模型,更提供开源之后的模型使用服务。从这个意义上说,魔搭社区探索的是 AI 开源 2.0 新范式,在这种服务新范式下,为开发者使用 AI 模型带来更多惊喜和便利。
打破 AI 应用瓶颈,模型社区势在必行
AI 产业化应用面临的瓶颈主要体现在以下两点:一方面是现有 AI 技术的局限性,单一 AI 模型只能针对单一的任务场景,泛化性能较为有限,面临新场景时需要重新训练,二次开发难度较高;另一方面是因为模型训练、推理、安装部署等配置复杂,使用门槛高。这使得 AI 只掌握在少数算法人员手中,难以走向大众化。
作为业内顶尖研究机构,达摩院对此有切身体会。自 2017 年成立以来,达摩院在 AI 领域进行大量研究和探索,产出了一批重要的 AI 模型,已经用于城市大脑、工业视觉、电商翻译、医疗AI、智能客服等诸多场景。
预训练模型的兴起让 AI 有了从手工作坊走向工业化大生产的机会。AI 模型通过上游统一的预训练后,面对下游各种任务场景后,只需要一些调优()就能有较好效果,研究者不再需要反复造轮子。不过,预训练模型尤其是大模型的研发门槛高,算力资源消耗大,它成为了少数机构的竞赛。
站在行业发展的角度看,这些模型的潜力仍然未得到充分发挥,AI 产业化的道路还充满挑战。达摩院意识到,只有进一步推动 AI 开放,才能实现 AI 普惠。达摩院不仅决定集中开源开放这五年来的重要 AI 成果,更不留余力打造 AI 模型社区。
构建开放社区绝非易事。在技术层面,需要持续不断地优质的模型供给,包括研发投入高的大模型;同时还提供易用的平台用户体验才能得到开发者的认可。在社区共建上,还要打消高校、科研机构、企业、个人等方面的疑虑,才能共同建设中文AI模型社区的新生态。
魔搭社区三大特色服务,普惠 AI 开发者
社区主要有三大优势:
1、提供丰富的中文模型,充分满足本土化需求
语言是从感知智能迈向认知智能的关键,理解中文,才能在中文世界的任务场景中取得更佳效果。现实情况却是,中文为母语的 AI 开发者人数众多,但世界上的中文 AI 模型数量稀少。
魔搭社区关注本土需求,第一批提供的中文 AI模型已超过 100 个,占比超过三分之一,覆盖了自然语言处理、语音等常用的任务,实用性较高。同时,社区还涌现了一批探索人工智能前沿的中文大模型社区50个创新小项目,如阿里通义大模型系列、澜舟科技的孟子系列模型、智谱 AI 的中英双语千亿大模型、中文版 GPT-3、中文版 CLIP 等。社区鼓励中文 AI 模型的开发和使用,希望实现中文 AI 模型的丰富供给。
2、零代码上手+强算力加持,带来绝佳用户体验
对于模型使用者,从代码下载到安装部署再到效果验证,以前往往需要数天,现在只要几个小时甚至几分钟。通过全新开发的调用接口和统一的配置文件,平台提供模型探索、环境安装、推理验证、训练调优等一站式服务,0 代码在线体验模型效果,1 行代码实现模型推理,10行代码实现模型定制;在线开发,开箱即用,无需任何安装部署。
对于模型开发者,平台提供模型管理、数据集管理、多人协同、创意工坊、社区互动等功能,让开发者可以轻松实现创新想法,并获得用户反馈,持续改进模型,最终收获影响力。
此外,魔搭社区基于云的算力支撑和技术支撑,提供了更佳的用户体验,让上层的 AI 模型开发和使用更简单。
3、开放兼容,普及 AI 模型应用
不同于一般企业举办的社区,魔搭社区更强调其中立性,更开放,模型更丰富,兼容 、、Caffe 等多种主流深度学习框架,模型迁移便捷简单,用户可自主选择训练和部署方式,提供更多自主可控的选择。社区旨在推动 AI 的大规模使用,不以盈利为目标,惠及所有开发者,参与者不限机构、不限类型。
据介绍,已有数千名开发者参与魔搭的前期测试,他们利用社区的 AI 能力搭建了射击游戏神枪手、简历分析、一键动画片制作等小应用。有参与测试的在校学生表示,魔搭最好的一点是这里只需一行代码即可调用,且调用过程十分简单快捷,即使是对于模型了解较少的开发人员也能快速上手。也有动画建模师称,魔搭中的 2D 关键点模型,很好地适配动捕的工作,卡通化模型可以轻松构建卡通形象,减少了工作量。
开发者体验社区的模型,能获得免费的 CPU算力和 GPU 算力的福利。其中CPU算力(8核32G)不限额度,GPU算力(-V100-)限额16个小时。开发者可以参与社区贡献,获得更多免费算力额度。
AI开源的未来
中国科学院院士、中国计算机学会(CCF)开源发展委员会主任王怀民期待,开源是AI发展的重要驱动力,魔搭社区作为新型的 AI 开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。
中国计算机学会副理事长、澜舟科技创始人兼 CEO 周明博士认为,从依赖算法专家手工调参的手工作坊时代,走向大规模、可复制的大工业时代,AI 模型社区是其中的关键一环,堪称 AI 时代的基础设施,能将预训练模型以较低门槛提供给广大开发者,让 AI 惠及全社会。
而达摩院希望,魔搭社区 能成为中国 AI 开发者和使用者的公共平台,甚至全世界的一个 AI 开放平台,能够满足 AI 开发者和应用者的多层次、多样化的需求,促进AI产业的共同繁荣。
免责声明:部分文章信息来源于网络以及网友投稿,本站只负责对文章进行整理、排版、编辑,出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性,如本站文章和转稿涉及版权等问题,请作者在及时联系本站,我们会尽快为您处理。