孟子 GPT 大模型是基于团队自研技术研发的大规模语言模型,经历预训练,SFT 和对齐等步骤。可处理多语言、多模态数据,同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。
孟子模型基于 Transformer 架构,拥有十亿、百亿到千亿参数量,基于数十万亿字符的数据训练而成,包括海量的互联网网页、社区、新闻、图书、电子商务网站、金融网站以及其他来源的高质量语料训练而成。
孟子是国内著名的大模型品牌,多次在中文大模型基准评测,例如 C-EVAL、SUPERCLUE 等取得优胜成绩。孟子大模型已于 2023 年底通过网信办生成式人工智能备案,并已正式面向公众开放服务。
孟子 GPT 大模型能够通过多轮对话,帮助用户在特定场景中完成各种工作任务,包括内容生成、语言理解、知识问答、推理、代码理解和生成、金融任务等。
除了 GPT 架构,澜舟也开发了基于 BERT、T5 等架构的模型,适用于信息抽取和机器翻译等技术中。