书生·浦语大模型全链路开源体系 | Notion

大模型背景

大模型迅速成为最热门的研究方向，不论是在工业界还是学术界，其受到了广泛的关注。主要原因在于大模型被视为发展通用人工智能（被看作是诞生人工智能“奇点”的必要条件）的一个重要途径。
热门研究方向已经从以前的专用模型时代（一个模型解决一个特定问题）逐渐演变为当前的大模型时代（多模态模型/一个模型解决不同的任务）。
其中一个大模型的例子就是ChatGPT-4，它具备多种模态（语言模态到视觉模态），能够处理各种任务，如情绪识别、命名实体识别、数据分析等。这显著提高了模型的通用性，并展示了通向高阶智能的潜在途径。

Untitled

上海人工智能实验室

在这个大模型背景下，上海人工程实验室投入了大量的研究力量，专注于语言模型以及整个大模型领域的研究工作。
开源了多模态的预训练语料库，各种大模型并对各类大模型进行升级。

Untitled

书生葡语

书生葡语提供了覆盖不同规模的大模型，包括轻量级（IntermLM-7B，70亿参数，低成本可用）、中量级（IntermLM-20B，200亿参数，商业定制）和重量级（IntermLM-123B，1230亿参数，全面通用），以便在各种场景中进行应用。

Untitled

IntermLM-20B在各个数据集下的表现都非常不错