AI训练模型

MOSS

该文章介绍了复旦大学团队开发的国内第一个发布的对话式大型语言模型——MOSS,它拥有对话生成、编程、事实问答等一系列任务执行能力,并宣布开源。

OpenBMB

OpenBMB旨在打造大规模预训练语言模型库与相关工具,加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛,推动大模型生态发展,实现大模型的标准化、普及化和实用化。OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起,拥有深厚的自然语言处理和预训练模型研究基础。

LLaMA

介绍了Meta(Facebook)推出的AI大语言模型,该模型具备多种功能,为网站内容提供了丰富的交互性和用户体验。同时,该模型也为企业提供了更多的商业机会。

阿里巴巴M6

M6是阿里巴巴达摩院推出的中文社区最大的跨模态预训练模型,参数达到十万亿以上,具有强大的多模态表征能力。通过统一加工处理不同模态的信息,沉淀成知识表征,为各个行业场景提供智能服务。

MiracleVision奇想智能

MiracleVision奇想智能是由美图秀秀公司推出的自研AI视觉大模型,具备美学导向和图像处理能力,广泛应用于多个行业,提高工作流效率。它提供了简单易用的AI视觉创作工具,支持AI图片生成、AI设计排版和AI视频生成等能力,使用户能够快速进行图像的创作和编辑。同时,MiracleVision奇想智能还提供了视觉模型商店,满足用户创造惊艳的视觉效果的需求。在电商、游戏制作、影视、广告设计和动漫卡通等行业,MiracleVision奇想智能都能发挥重要作用,助力行业提效。

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练,为用户提供了一种新的选择,可以更加高效地实现模型训练。

Cohere

Cohere是一个提供大语言模型的平台,帮助企业构建高性能的AI产品,并提供AI驱动的搜索文本、分类文本和生成文本等服务。此外,它还提供了Playground供用户试玩,以及LLM University课程,帮助用户了解大型语言模型及其体系结构的基础知识。

Sora

Sora是由OpenAI研发的AI视频生成模型,具备将文本描述转化为视频的能力,能够创造出既逼真又富有想象力的视频场景。该模型专注于模拟物理世界的运动,旨在帮助人们解决需要现实世界互动的问题。相较于其他AI视频工具,Sora能够生成长达一分钟的视频,同时保持视觉质量和对用户输入的高度还原。除从零开始创建视频,Sora还能基于现有静态图像生成动画,或者扩展和补全现有视频。 Sora的主要功能包括文本驱动的视频生成、视频质量与忠实度、模拟物理世界、多角色与复杂场景处理以及视频扩展与补全。该模型的技术原理包括

商量SenseChat

商汤科技推出的人工智能大语言模型"商量SenseChat",基于自然语言处理技术,具备超凡的语言理解、生成能力,将科技与人文相互交融。它类似于ChatGPT,能秒解复杂问题,提供定制化建议,还能辅助创作一流文本,具备不断学习进化的特性。

Jan

Jan AI是一个免费开源的本地运行大模型并进行AI聊天对话的工具,支持在Windows、Mac(Intel、M1/M2/M3)和Linux等操作系统运行,后续还将推出移动端APP。用户可以在本地电脑(Windows、Mac、Linux)上安装、部署、运行并使用开源版本的ChatGPT替代大模型,如LLaMa、Mistral、Phi-2等20多个模型。相较于AI工具集此前介绍的Ollama,该工具提供了对话UI和API服务器,适合开发者、研究人员或AI爱好者本地体验开源的大模型。Jan还在持续开发中,后