花粉乐分享平台宣传视频
> 乐学堂 > > 做中国版ChatGPT,还有一个“隐身”大玩家
做中国版ChatGPT,还有一个“隐身”大玩家
来源:机器之心Pro
2023-05-25 18:08:54
194
管理

机器之心报道

作者:泽南

「通用人工智能是未来十到二十年国际科技竞争的战略制高点,其影响力相当于信息技术领域的『原子弹』。」3 月 4 日,在全国政协会议上,北京通用人工智能研究院院长朱松纯在一份提案中建议,要将发展通用人工智能提升到当代「两弹一星」的高度,抢占全球科技与产业发展制高点。

过去很长一段时间里,通用人工智能对于大多数 AI 学者来说是个遥不可及的目标,最近 ChatGPT 的出现却让人感觉:通用人工智能似乎已近在眼前。

ChatGPT 可以胜任各种任务,如搜索问答、文本生成甚至代码生成等,完全超越了人们印象中的 AI 智能助手。在使用者看来,它不仅能分辨出提问者的真实诉求,还拥有出乎预料的博识程度。

但在 ChatGPT 引发的全球技术竞赛中,我们剩下的时间可能不多了:上周三,OpenAI 开放了 ChatGPT API,开发者现在可以通过程序接口将 ChatGPT 和 Whisper 模型的能力集成到自身应用中。过不了多久,我们就能在各种常用 App 上见到「史上最强 AI」的强大能力了。

图源:https://lifearchitect.ai/chatgpt/

在 GPT 系列的发展过程中,「炼大模型」逐渐成为了人们提升 AI 性能的重要方式。短短几年,AI 模型的参数量已经从最初的数亿扩张到千亿,甚至万亿规模。

由于 AI 大模型的复杂程度,要想复制 ChatGPT 的成功,意味着技术团队必须要有足够的技术积淀,能动用大量数据和基础设施。在追赶的竞赛中,国内可能很难出现像 OpenAI 这样背靠巨头,「拥有无限资金」的创业公司。重任落到了大厂肩上。

从参数规模来看,国内科技公司的实验室里已经诞生过能够比肩最新版 GPT 体量的语言大模型。根据目前的消息,百度、阿里、腾讯等科技大厂,也已经纷纷官宣进入 ChatGPT 风口。

百度是最早针对 ChatGPT 做出明确表态的公司之一,在人工智能技术四层架构中的全栈布局是其应战的底气。2021 年底,百度曾共同发布了全球首个知识增强千亿大模型「鹏城 - 百度・文心」,模型参数达 2600 亿,是当时全球最大中文单体模型,在 60 多项任务上取得了最好效果。

在微软与谷歌争夺 ChatGPT 搜索首发的同时,百度也官宣了将在 3 月 16 日推出类 ChatGPT 产品「文心一言」。

大语言模型的规模和能力在过去四年中呈指数级增长。

图片来源:https://huggingface.co/blog/large-language-models

到了 ChatGPT 这里,外界普遍估计其参数规模约在 1750 亿左右,它经由微软专门建设的 AI 计算系统训练,总算力消耗约为 3640 PF-days。而在推理阶段,以今年 1 月份独立访客平均数 1300 万计算,ChatGPT 对应的芯片需求为 3 万多块英伟达 A100 GPU,初始投入成本约为 8 亿美元,每天光是花掉的电费就要 5 万美元。

此前在 2022 年 11 月,英伟达在官网的公告中表示,数万颗 A100/H100 高性能芯片已被部署在微软 Azure 上,其成为了第一个使用英伟达高端 GPU 构建的大规模 AI 计算集群。

大模型增加了科技公司对专用 GPU 的需求。财报显示,英伟达 2023 财年 AI(数据中心)业务全年收入达 150.1 亿美元,创下历史新高,同比增长了 41%,其中第四季度 AI 业务收入 36.2 亿美元,同比增速为 11%。英伟达 CEO 黄仁勋表示,ChatGPT 是人工智能领域的 iPhone 时刻,也是计算领域有史以来最伟大的技术之一。

这种投入远超以往 AI 领域的研究:强如微软,在帮 OpenAI 打造 ChatGPT 时都因为算力不足而面临内部压力,还被迫暂停了一些其他项目。

对于想构建 ChatGPT 级别产品的国内公司来说,目前高性能 GPU 芯片面临短缺问题,硬件、运营成本,快速商业化是肉眼可见的挑战,参与者需要具备强大的硬件基础,丰富的工程经验,以及敢于投入的意志。

在用于大模型的 AI 算力上,国内几家科技公司也有相应的准备。

去年 5 月,百度智能云宣布落地了新一代高性能 AI 计算集群,提供 EFLOPS 级算力支持。据报道,该集群基于 NVIDIA A100 GPU 和 InfiniBand 网络构建,研究人员可基于全新发布的实例组建上千节点规模的超高性能计算集群,成倍缩短超大 AI 模型的训练时间。经过百度 NLP 研究团队的验证,在该集群上提交千亿模型训练作业时,同等规模下整体训练效率是普通 GPU 集群的 3.87 倍。

在国内科技公司行列中,说到算力,华为有着自己的先天优势。从盘古大模型的新闻中,我们经常会看到鹏城云脑、昇腾 AI 芯片的字样。

新兴的 AI 技术也面临着技术落地的挑战。在很多行业应用中,人们需要针对业务场景开发一系列定制化模型,各自完成数据清洗、数据增强、模型适配等工作,这些模型面临着难以复用的挑战。预训练大模型的逻辑是提前将知识、数据、训练成果沉淀到同一个模型中,再由不同应用的开发者在此基础上进行二次开发和微调,就像一个基础通用的技术底座,可以大幅提升效率。

这让 AI 具备更多的普惠属性,华为基于盘古提出了以大模型为核心的普适 AI 建模工作流,能让一个模型覆盖多个场景,减少专家的干预和人为调优的消耗,大幅提升技术落地效率,也降低了技术门槛。这或许是搜索引擎之外,能让大模型更广泛应用的正确方向。

不难看出,AI 领域发展到了 ChatGPT 时代,早已不再是比某项领先的技术,而是在比整套技术体系,真正具备全栈实力的公司会很快脱颖而出。

那么,ChatGPT 军备竞赛,华为会出手吗?根据最近的消息,在华为内部,有项目已在研发过程中了。

花粉社群VIP加油站

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
lulu()
文章
422
主题
0
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行
随手拍
53个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备2024061738号-1
1
0
分享

个人中心

每日签到

我的消息

内容搜索