AI训练模型

LLaMA

介绍了Meta(Facebook)推出的AI大语言模型,该模型具备多种功能,为网站内容提供了丰富的交互性和用户体验。同时,该模型也为企业提供了更多的商业机会。

MOSS

该文章介绍了复旦大学团队开发的国内第一个发布的对话式大型语言模型——MOSS,它拥有对话生成、编程、事实问答等一系列任务执行能力,并宣布开源。

PaLM 2

PaLM 2 是谷歌的下一代大语言模型,具有改进的多语言、推理和编码能力。多语言性: PaLM 2 在多语言文本方面接受了更多的训练,涵盖 100 多种语言。推理: PaLM 2 的广泛数据集包括科学论文和包含数学表达式的网页。因此,它展示了逻辑、常识推理和数学方面的改进能力。编程: PaLM 2 在大量公开可用的源代码数据集上进行了预训练。这意味着它擅长 Python 和 JavaScript 等流行的编程语言,但也可以生成 Prolog、Fortran 和 Verilog 等语言的专用代码。

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练,为用户提供了一种新的选择,可以更加高效地实现模型训练。

Gen-2

Runway最新推出的AI视频生成模型,基于人工智能技术,能够生成高质量、个性化的视频内容。该模型具有广泛的应用前景,可以应用于娱乐、教育、广告等领域,为用户提供更加生动、有趣的视频体验。

StableLM

StableLM是由Stable Diffusion背后的团队Stability AI最新推出的开源的类ChatGPT大语言模型,该模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿,后续还将推出150亿到650亿参数模型。

Lamini

Lamini是一个强大的LLM引擎,它可以让任何开发人员,在大型数据集中,轻松地将高性能的LLM训练得像ChatGPT一样好。无论你是刚开始探索机器学习领域,还是已经有了一定的经验,都可以从Lamini中受益。

阿里巴巴M6

M6是阿里巴巴达摩院推出的中文社区最大的跨模态预训练模型,参数达到十万亿以上,具有强大的多模态表征能力。通过统一加工处理不同模态的信息,沉淀成知识表征,为各个行业场景提供智能服务。

魔搭社区

阿里达摩院推出的AI模型社区包含超过300+开源AI模型,为开发者提供了丰富的选择。