随着生成式人工智能技术的不断成熟,人们的创作方式得到了不断的革新,通过输入一段文字就能创作一幅高质量的画作、一段代码或一首古诗。在垂直专业领域,通过对生成式人工智能大模型进行微调也能赋能专业领域的生产力。
因此,各行各业都在积极探索生成式人工智能大模型的落地应用,这推动生成式人工智能大模型所对应计算资源的需求日益增长。随着需求的井喷,如何快速高效地获取和部署生成式人工智能大模型成为诸多企业与开发者的重要诉求。
为了有效满足客户对生成式人工智能大模型的算力与快速部署需求,金山云近期发布了ChatGLM-6B、Stable Diffusion及Alpaca-Lora三款生成式人工智能大模型镜像。当前所有大模型均免费提供,客户只需要为选择的GPU云服务器付费,通过几个简单的步骤,可分钟级完成生成式人工智能大模型微调或推理环境的搭建,赋能各领域的生产力需求。
生成式人工智能大模型部署步骤
1.登录金山云「云服务器KEC控制台」
2.单击「新建实例」,按需完成相关 GPU 云服务器配置
GPU云服务器选型参考:
https://docs.ksyun.com/documents/6526
3.镜像类型选择镜像市场-工具软件,选择需要部署的大模型所对应的市场镜像,如ChatGLM-6B
4.完成网络与系统配置并提交订单以创建GPU云服务器
5.连接登录GPU云服务器,按照选择的市场镜像对应的使用指南,执行进程启动命令
使用指南获取方法:
进入云市场https://market.ksyun.com/list,搜索对应的市场镜像名称,点击进入后下载使用指南
镜像市场生成式人工智能模型介绍
ChatGLM-6B
ChatGLM-6B是由清华大学开源发布的具有62亿参数的入门级中英双语开源模型。通过对大量数据进行训练,ChatGLM具备中英文问答和对话能力。ChatGLM-6B在1:1比例的中英语料上训练了1T的token量,与国外模型相比,具有更加出色的中文对话能力,更加适合国内企业与开发者探索落地应用方向。
同时,ChatGLM-6B优化了模型的参数和大小,结合金山云提供的ChatGLM-6B镜像和对应GPU云服务提供的快速部署能力,各企业及开发者微调和部署ChatGLM-6B的门槛大大降低。
ChatGLM-6B在金山云云服务器上的实机部署后推理演示示例:
例如输入「请创作一首古诗」,输出:
Stable Diffusion
Stable Diffusion是由Stability人工智能公司开源发布的生成式人工智能模型,能够根据文本或已有图片生成高分辨率的图像。Stable Diffusion模型经过大量高质量图像训练且高度灵活,能够生成各种类型(如人物、风景等)的图像,生成的图像具有较高的逼真度和细节表现力,为开发者提供了广泛的应用场景。
通过金山云提供的Stable Diffusion镜像和GPU云服务,开发者可以快速部署该开源预训练模型的环境并进行对应的微调和推理,降低了学习和使用门槛。
Stable Diffusion在金山云云服务器上的实机部署后推理演示示例:
例如输入
「masterpiece,best quality 1squirrel,cute,hat,tree」输出:
Alpaca-Lora
Alpaca-Lora是使用Lora(Low-rank Adaptation)技术在Meta的LLaMA 7B模型上微调而生成的轻量级开源模型。其优势是速度更快、使用的显存更少,结合金山云提供的Alpaca-Lora镜像和GPU云服务大大降低了企业和开发者部署类ChatGPT模型微调和推理环境的使用门槛。
Alpaca-Lora在金山云云服务器上的实机部署后推理演示示例:
例如输入「make a poem」,输出: