当前位置：首页 > 元宇宙 > AI

GPT-4：突破巨大参数规模的下一步之旅

来源：责编：时间：2023-08-15 18:48:15 176观看

导读07月13日消息，外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露，GPT-4在架构和参数方面有着显著的提升，以及采用了混合专家模型(Mixtureof Experts)的构建方式。据悉，GPT-4采用了混合

07月13日消息，外媒Semianalysis最近对OpenAI于今年3月发布的GPT-4大模型进行了深度揭秘。据他们透露，GPT-4在架构和参数方面有着显著的提升，以及采用了混合专家模型(Mixtureof Experts)的构建方式。

据悉，GPT-4采用了混合专家模型，这种模型利用数据进行训练，将多个模型分别训练后，将它们的输出整合为一个单独的任务。为了保持合理的成本，OpenAI选择了这种方式进行构建。GPT-4总共有120层，包含了1.8万亿个参数，相比之下，GPT-3只有约1750亿个参数，可见其在规模上的巨大提升。

GPT-4使用了16个混合专家模型，每个模型拥有1110亿个参数，并且每次前向传递路由都会经过两个专家模型。此外，它还拥有550亿个共享注意力参数。为了进行训练，OpenAI使用了一个包含13万亿个tokens的数据集，这些tokens并非唯一，而是根据迭代次数计算出更多的tokens。

据ITBEAR科技资讯了解，GPT-4在预训练阶段的上下文长度为8k，32k版本则是对8k版本的微调结果。然而，GPT-4的训练成本非常高昂。根据外媒报道，即使使用了8倍H100物理机，也无法以每秒33.33个token的速度提供所需的密集参数模型。据估算，一次GPT-4的训练成本高达6300万美元(约4.51亿元人民币)。

为了降低训练成本，OpenAI选择在云端使用A100GPU进行模型训练，最终将训练成本降低至大约2150万美元(约1.54亿元人民币)，尽管需要更长的时间来完成训练过程。这一举措在一定程度上减轻了训练成本的压力。

本文链接：//www.dmpip.com//www.dmpip.com/showinfo-45-999-0.htmlGPT-4：突破巨大参数规模的下一步之旅

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：前沿技术、机器人和集成电路成为人工智能领域热门融资领域

下一篇：新一代AI笔记应用Notebook LM亮相：优化信息整理与解答需求

标签：

热门焦点

Meta正在研发元宇宙语音助手；广东省462家企业申请元宇宙商标

今日《元宇宙新鲜事》有：扎克伯格透露正在为元宇宙研发语音助手；完美世界声明称不会以“元宇宙投资项目”等名义吸收资金。广东省申请元宇宙商标的企业达462家位
2030年的元宇宙产业将会如何发展？

对互联网巨头传统业务的反垄断政策倒逼互联网企业颠覆创新，寻找新的增长点，移动互联网流量空间见顶之际，元宇宙时代红利已然开启。序章：元宇宙应用场景大猜想元宇
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
小众有趣NFT艺术作品欣赏（1）

随着NFT发展火热，越来越多领域与NFT融合，NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处，也有完全不同的地方。NFT艺术与传统艺术一样，表现了
以太坊伦敦升级后，随之生效的以太坊EIP-1559是什么？

作者：三黎过去的一年里，除了 BTC 一如既往稳坐王位，DEFI 则是贯穿一整年的狂欢热点。 DeFi 在让 ETH 实现价值增长的同时，也使得其网络日渐拥堵、交易费用增高，成为
用户可以把自己的医疗健康数据做成NFT出售给医药公司挣钱

你可能听说过不可伪造的代币，或NFTs。NFTs是数字代币，代表完全独特的项目的所有权；存储在区块链中并可追踪，它们不能被修改、替换或复制。作为NFT铸造的资产在数字
以用户为中心，Web3和区块链如何将用户放在首位

竞争优势正在改变竞争优势是每个企业都在努力争取的，由谷歌、Facebook和Netflix等大型科技公司主导的市场中，两大重要类别的竞争优势十分突出。第一个竞争优势来
对讽刺无动于衷，Nori将碳市场放在区块链上

当我们聊气候问题的解决方案时，以太坊区块链应该不是最首想到的，但这正是Nori所选择的方案，它建立了一个引擎，鼓励农民使用负碳耕作方法，将空气中的碳抽出并放回地
这场虚拟发布会，当面“造假”！

英伟达去年4月份那场发布会，你曾看出什么不对劲的地方吗？你品，你细品——在计算机图形学顶会SIGGRAPH 2021上，英伟达通过一部纪录片自曝：那场发布会内藏玄机~你看到