AI训练模型

商量SenseChat

商汤科技推出的人工智能大语言模型"商量SenseChat",基于自然语言处理技术,具备超凡的语言理解、生成能力,将科技与人文相互交融。它类似于ChatGPT,能秒解复杂问题,提供定制化建议,还能辅助创作一流文本,具备不断学习进化的特性。

LLaMA

介绍了Meta(Facebook)推出的AI大语言模型,该模型具备多种功能,为网站内容提供了丰富的交互性和用户体验。同时,该模型也为企业提供了更多的商业机会。

阿里巴巴M6

M6是阿里巴巴达摩院推出的中文社区最大的跨模态预训练模型,参数达到十万亿以上,具有强大的多模态表征能力。通过统一加工处理不同模态的信息,沉淀成知识表征,为各个行业场景提供智能服务。

Gen-2

Runway最新推出的AI视频生成模型,基于人工智能技术,能够生成高质量、个性化的视频内容。该模型具有广泛的应用前景,可以应用于娱乐、教育、广告等领域,为用户提供更加生动、有趣的视频体验。

悟道

北京智源研究院推出的悟道2.0是中国第一个超大规模智能模型系统,旨在超越OpenAI的GPT-3和谷歌的LaMDA,实现通用人工智能(AGI)和人类水平的思维。悟道接受4.9TB高质量英文和中文图像和文本的训练,使用MoE系统进行训练,旨在实现更好的预测结果。

DeepSpeed

微软开源的低成本实现类似ChatGPT的模型训练,为用户提供了一种新的选择,可以更加高效地实现模型训练。

Cohere

Cohere是一个提供大语言模型的平台,帮助企业构建高性能的AI产品,并提供AI驱动的搜索文本、分类文本和生成文本等服务。此外,它还提供了Playground供用户试玩,以及LLM University课程,帮助用户了解大型语言模型及其体系结构的基础知识。

GPT-4

GPT-4是OpenAI开发的自然语言处理模型,依靠强大的神经网络来理解和生成类似人类的语言。GPT-4通过被称为「转换器(Transformer)」的特殊架构来帮助软件理解单词的含义以及它们在句子中的组合方式。通俗来讲,Transformer帮助计算机找出如何将所有的词以正确的顺序放在一起,使之有意义。GPT-4的工作原理包括Transformer架构、大规模的预训练、微调(Fine-tuning)、分词(Tokenization)、上下文窗口(Context window)、概率分布和抽样、细粒度控制

MOSS

该文章介绍了复旦大学团队开发的国内第一个发布的对话式大型语言模型——MOSS,它拥有对话生成、编程、事实问答等一系列任务执行能力,并宣布开源。