大模型背景
- 大模型迅速成为最热门的研究方向,不论是在工业界还是学术界,其受到了广泛的关注。主要原因在于大模型被视为发展通用人工智能(被看作是诞生人工智能“奇点”的必要条件)的一个重要途径。
- 热门研究方向已经从以前的专用模型时代(一个模型解决一个特定问题)逐渐演变为当前的大模型时代(多模态模型/一个模型解决不同的任务)。
- 其中一个大模型的例子就是ChatGPT-4,它具备多种模态(语言模态到视觉模态),能够处理各种任务,如情绪识别、命名实体识别、数据分析等。这显著提高了模型的通用性,并展示了通向高阶智能的潜在途径。

上海人工智能实验室
- 在这个大模型背景下,上海人工程实验室投入了大量的研究力量,专注于语言模型以及整个大模型领域的研究工作。
- 开源了多模态的预训练语料库,各种大模型并对各类大模型进行升级。

书生葡语
- 书生葡语提供了覆盖不同规模的大模型,包括轻量级(IntermLM-7B,70亿参数,低成本可用)、中量级(IntermLM-20B,200亿参数,商业定制)和重量级(IntermLM-123B,1230亿参数,全面通用),以便在各种场景中进行应用。

- IntermLM-20B在各个数据集下的表现都非常不错