最新成果!百度CTO王海峰揭秘文心大模型4.0

2023年10月29日

  本报讯(沈阳日报、沈报全媒体高级记者刘洋)10月26日-28日,第二十届中国计算机大会(CNCC2023)在沈阳举办,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在会上解读文心大模型最新技术,阐述大模型产业模式。据了解,自文心一言3月发布至今,文心大模型4.0训练算法效率提升3.6倍,周均训练有效率超过98%,推理性能提升50倍。

  王海峰认为,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,且越来越强,为发展通用人工智能带来了曙光。

  百度在3月16日发布了知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。文心4.0的理解、生成、逻辑、记忆四大能力显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑能力的提升幅度达到理解能力的近3倍,记忆能力的提升幅度也达到了理解能力的2倍多。

  公开数据显示,文心一言面向全社会开放一个多月,用户规模达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。飞桨和文心生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。

  现场,王海峰进一步展示了文心一言的理解、生成、逻辑、记忆能力。文心一言精准推荐了沈阳的赏秋胜地,根据指令作了一首以“虎”为题又不出现“虎”字的诗,生动表现了森林之王老虎的威猛形象。

  面对大模型产业化的挑战,王海峰表示,类似芯片代工厂模式,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。目前,这一产业化路径已在文心大模型产业实践中得到验证,百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型,正加速大模型产业化落地。

标签