ChatGPT，AI界的iPhone时刻

2023-03-07

　　来源：雪球App，作者：翼虎投资余定恒，（https://xueqiu.com/1733925115/243641583）

　　ChatGPT具有划时代的意义，类似乔布斯发明手机，莱特兄弟发明飞机

　　投资机会：、360、

　　一、ChatGPT

　　1.1、ChatGPT是什么：美国OpenAI研发的聊天机器人程序，AI界的iPhone时刻

　　ChatGPT（全名：ChatGenerativePre-trainedTransformer），美国OpenAI研发的聊天机器人程序，于2022年11月30日发布。

　　ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

　　ChatGPT还轻松通过一些对人类难度较高的专业级测试：它新近通过了谷歌编码L3级（入门级）工程师测试；分别以B和C+的成绩通过了美国宾夕法尼亚大学沃顿商学院MBA的期末考试和明尼苏达大学四门课程的研究生考试；通过了美国执业医师资格考试……

　　1.1.1、英伟达CEO黄仁勋：人工智能时代的“iPhone时刻”

　　ChatGPT的诞生对于AI领域来说就等同于iPhone在智能手机领域中的诞生，都是拉开一个新时代帷幕的重要时刻，是计算机行业最伟大的事情之一，具有里程碑意义。

　　ChatGPT本质上将会使计算民主化，称这是人工智能和计算领域有史以来最伟大的存在。

　　1.1.2、ChatGPT的诞生类似莱特兄弟发明飞机

　　“大家都知道飞机理论上是可以做出来的，但从来没人真的见过飞机。ChatGPT就像是有人突然把飞机摆到你面前，虽然它可能只能飞100公尺，很容易有故障，但它出现了。”

　　1.2、ChatGPT是人类历史上增长最快的应用程序

　　美国人工智能公司OpenAI的大语言模型ChatGPT在推出约两个月后，已达到1亿月活跃用户，成为历史上增长最快的应用程序。

　　而据应用分析公司SensorTower的数据，TikTok在全球上线后花了大约9个月的时间才增加了1亿用户，而Instagram则花了30个月时间。其它消费性应用用户达到1亿的时间，则更长。早期带有人工智能能力的谷歌翻译达到1亿用户，则用了78个月。

　　1.3、ChatGPT的发展历程

　　训练数据从GPT2的5GB内存训练数据增长到GPT3的45TB。训练一次费用高达460万美元。

　　2022年11月发布ChatGPT,即进化后的GPT3.5，ChatGPT的本质上是一个由浮点数参数表示的深度神经网络大模型（目前版本含约1750亿个参数），属于深度学习的框架。

　　GPT3.5的基座模型还是使用的GPT3.

　　1.4、ChatGPT成功的关键1.4.1、OpenAI坚持LLM（大型语言模型）信念

　　ChatGPT成功的关键与OPENAI始终坚定地把LLM（大型语言模型）看做是通往AGI(通用人工智能)的一条必由之路的信念有关：

　　从研究“道义”的角度讲，大模型就是为了以无监督方式解放人类标注工作。但是OpenAI从前身InstructGPT开始，就开始引入了标注团队，利用人工标注+RLHF提高模型的可用性，方法论方面走了回头路；

　　从另一个层面来看，完全无监督的情况下，大模型的发展已经到了硬件指数级增换来模型线性指标提升的状态，边际收益开始降低，模型再大，美国人无法承受。

　　ChatGPT相对与GPT3的进化更多是巧妙利用了人工标注，而非深刻模型本身的架构突破。

　　2）小模型处理常规NLP问题，如分类打标签、信息抽取、阅读理解等，需要通过标注+训练的过程，非常规问题需要精巧的设计。

　　3）GPT-3用预测下一个字的方式来表达智能，可以根据上段文本生成下段文本，但是我们人类跟它交流起来并不是很方便。所以OpenAI将它进化为ChatGPT，其实上也就是提供了一个人机交互的接口。

　　1.4.2、资源开放

　　ChatGPT能做出来，除了OpenAI的努力，实际上所有的成果都不是OpenAI，里边用到的各种算法，各种模型，都是美国几十年下来，包括谷歌很多公司、大学、实验室，公布了开源的算法、论文，这种集大成者，所以ChatGPT是很恰当地把这些成果用到了一起，这是对我们第一个启发，我管它叫OpenSource（资源开放）。我认为是新时代的集中力量办大事，大家一定要相互交流成果，而不是封闭起来，画地为牢。

　　1.4.3、OpenAI和微软合作

　　OpenAI更像是有理想的研究机构，它选择了一条最难的任务就是做强人工智能，用通用大模型解决通用问题。

　　如果没有这种格局和长期主义，即使是、谷歌、Meta这些公司也不行，公司大到一定时候，最大的障碍是实用主义。

　　在2019年向OpenAI投入了10亿美元；

　　2023年1月25日，已与OpenAI扩大合作伙伴关系，微软将向OpenAI进行一项为期多年、价值再投100亿美元的投资，以加速其在人工智能领域的技术突破。

　　1.4.4、产业化公司的介入1.4.4.1、成本：单次模型训练耗时1个月，训练成本达1200万美元

　　在算力上，ChatGPT的总算力消耗约为3640PF-days，即假如每秒计算一千万亿次，需要计算3640天，一次模型训练成本超过1200万美元。

　　在美国，只有、谷歌、Meta几家公司有能力支撑这样高昂的成本；

　　在中国，也只有、阿里、腾讯等少数几家公司能够支撑，这也注定大语言模型是大型互联网公司游戏。

　　ChatGPT以当前业界主流的Transformer模型为主结构，单次模型训练耗时1个月，训练成本达1200万美元，超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑，因此他判断1000张主流卡容量的独立计算集群是完成该类任务的门槛之一。

　　GPT-3训练一次的成本约为140万美元，对于一些更大的LLM（大型语言模型），训练成本介于200万美元至1200万美元之间。

　　以ChatGPT在2023年1月的独立访客平均数1300万计算，其对应芯片需求为3万多片A100GPU，初始投入成本约为8亿美元，每日电费在5万美元左右。

　　如果将当前的ChatGPT部署到谷歌进行的每次搜索中，需要512820.51台A100HGX服务器和总共4102568个A100GPU，这些服务器和网络的总成本仅资本支出就超过1000亿美元。

　　此外，ChatGPT估算生成一条信息的成本约为1.3美分，是目前传统搜索引擎的三到四倍。

　　1.4.4.2、工程化

　　ChatGPT的成功一部分是技术，一部分是产品体验，还有一部分是工程化，这里边看起来很简单，把多少亿的数据送进去进行训练。我认为这次ChatGPT成功，出了很多算力、工程师，帮它解决工程化的问题。

　　1.4.4.3、公司比较擅长的是用户产品体验

　　很多做研究的科学家可能技术完成了，但这东西有人没有人用，因为用户体验很重要。手机再有AppStore，如果它的体验界面做得不好，这个产品也是不能成功的。所以我觉得在这方面的贡献应该做了很多。

　　1.4.4.4、最后这件事还要找到商业模式

　　因为运算的成本很高，训练、推理、运转的成本高，如果找不到商业模式，这事难以为继，但你让科学家们去想挣钱的事，可能会错位。这应该是商业公司来做。

　　1.4.4.5、生态

　　光有大厂是不够的。大家现在都意识到了这东西像一个操作系统或者像云服务、AppStore一样，无论你打什么比喻它上面一定要有垂直的应用。我是觉得国内要做，无论谁做这大模型，都要早点开始考虑不能把它做成封闭的，而是把它变成开放的市场的概念。

　　1.4.4.6、面对用户

　　强大的用户流量的反馈，上亿的用户，个人和企业都能用极低的门槛，使用ChatGPT，这里面用户使用意图的猜测，使用问题满意度的反馈，都会给ChatGPT带来不断的改进，推动智能飞轮越转越快。

　　1.5、ChatGPT的未来发展1.5.1、新产品：2023年将发布GPT4.0

　　2023年OpenAI会在现在爆火的版本上推出GPT4.0，未来是一个兴奋又充满不确定性的世界。

　　人类的大脑皮层有140多亿个神经细胞，每个神经细胞又有3万多个突触。所以，大脑皮层的突触总数超过100万亿个。所谓的神经细胞就是通过这些突触相互建立联系。假设GPT-4实现100万亿参数规模，堪比人的大脑，意味着它达到与人类大脑神经触点规模的同等水平。

　　1.5.2、原理念：LLM（大型语言模型）通往AGI(通用人工智能)

　　OPENAI始终坚定地把LLM（大型语言模型）看做是通往AGI(通用人工智能)的一条必由之路。

　　在OpenAI眼中，未来的AGI（通用人工智能）应该长这个样子：有一个任务无关的超大型LLM，用来从海量数据中学习各种知识，这个LLM以生成一切的方式，来解决各种各样的实际问题，而且它应该能听懂人类的命令，以便于人类使用。

　　1.5.3、做平台：孵化垂直应用

　　据说ChatGPT已经找了100家左右的垂直类的创业小公司跟他们来合作，他们在ChatGPT的云服务的基础之上，来孵化100个垂直应用。

　　ChatGPT一个月收费，一个账号也就几十美金，将来一年可能199美元或者几百美元。所以它要扶植的一定是垂直应用。

　　如果没有AppStore，不可能成为一个平台，苹果就是一个触摸屏的。所以这是一种非常去中心化，市场化的发展方向。

　　二、百度李彦宏：我们站在浪潮之巅（产品最受益）

　　2.1、逻辑1：有数据，中文搜索绝对第一

　　截至2020年7月，我国搜索用户人群规模已达到了7.50亿；

　　2020国内搜索引擎市场份额占有率排名占比情况，占比69.55％

　　模型训练离不来互联网中海量的文本数据，而的搜索业务在真实数据和用户需求理解上的积累有较强的先发优势，这些大规模的数据可以支撑ERNIEbot的充分预训练。随着ERNIEBot面向公众的开放，其有望建立起立真实的用户调用和模型迭代之间的飞轮，模型也会越来越聪明。

　　2.2、逻辑2：有技术，有全球最大中文单体模型（模型参数达2600亿）

　　四层布局（芯片层、框架层、模型层和应用层）

　　2.2.1、芯片层面：自研AI芯片“昆仑”

　　自研AI芯片“昆仑”已在多场景实际部署几万片，在公司搜索业务中也已形成较强工程化实践，从而保证了最底层的算力。

　　2.2.2、模型层面，百度文心系列大模型在行业已普遍应用

　　早在2019年，就推出文心大模型，这一模型和OpenAI专注的GPT模型类似，如今已经迭代多代，正因为此，“文心一言”所基于的ERNIE系列模型也已具备较强泛化能力和性能。以最新发布的ERNIE3.0Zeus为例，该模型迭代于ERNIE3.0，拥有千亿级参数。其已经具备智能创作等各类自然语言理解和生成任务，且公开数据集上小样本学习、理解和生成任务效果皆好于业界其他模型。

　　2.2.3、算法方面，多个大模型训练的基础设施

　　拥有多个云计算可用区、庞大的超算集群，奠定大模型训练的基础设施；目前公司有阳泉、徐水、定兴三个云计算中心，有了这样的基础建设，百度智能云就可以为ERNIE大模型应用提供高并发、高弹性、高精度等不同计算需求。

　　2.2.4、AI应用：搜索等

　　除了搜索之外，百度还将通过向公众开放大型语言模型，帮助企业在百度云上构建他们自己的模型和应用程序，以提高企业的生产力。

　　李彦宏表示“我们相信它（ChatGPT）将成为云计算的游戏规则改变者。人工智能正在大规模地改变许多行业，我们对即将到来的事情感到非常兴奋。我们正在围绕文心一言机器人建立人工智能生态系统。到今天已经有很多组织决定将文心一言集成进他们的产品和服务，一切才刚刚开始。”

　　2.3、逻辑3：有产品，大模型类项目“文心一言”，计划在3月发布

　　2022年以来，围绕文心大模型展开了一系列动作。5月，百度提出了「构建更适配应用场景的模型体系」；11月，文心大模型全面升级，发布了包括5个行业大模型在内的11个大模型，同时发布了AIGC绘画产品「文心一格」。

　　同时，计划将多项主流业务与文心一言整合。

　　三、360周鸿祎：称搭不上ChatGPT企业会被淘汰（安全最受益）

　　3.1、逻辑1：老板有决心，有资金，信心值万金

　　2月9日，360创始人周鸿祎在《星空下的对话》节目中谈到ChatGPT，他直言如果企业搭不上ChatGPT这班车，很可能会被淘汰，360不会放弃对该技术的跟踪。

　　公司已将ChatGPT作为核心战略。公司创始人周鸿祎在2023年2月9日“星空下的对话”节目中公开表示：ChatGPT可能代表着“人工智能历史上一场真正革命的开始”，同时公司长期做搜索引擎，拥有大量算力、NLP处理模型等要素，还拥有财力支撑，将大力推进ChatGPT技术。

　　具体来看，截至2022年三季报公司拥有货币资金219亿元，能够保证公司在ChatGPT大量算力、研发等开支；同时公司相较于国外同行落后的主要是预训练大模型和有效的多模态数据清洗与融合技术，在继续深入自行研发的同时，不排除寻找强有力的合作伙伴，以开放的心态搭建多方共享平台、补足短板，快速缩小差距。

　　3.2、逻辑2：有数据，公司搜索引擎全国市占率第二

　　中国搜索引擎位列第二，数据优势领跑人工智能革命。根据公司披露，360搜索是中国搜索引擎的Top2，拥有领先的数据，日均抓取超过20亿次，抓取量超过10000亿张网页和200亿条索引，积累了国内领先的海量数据抓取经验和完整的页面质量优化体系。在网页端有15万个优质权威站点和18亿张优质页面，在自建知识库方面360问答和360百科提供了近2000万词条和6亿条问答，在垂类数据方面有6亿篇360文库、7300万篇精选摘要和1亿条360题库。

　　公司拥有B端+C端的多维产品矩阵，同时拥有多样化的AI落地场景，可将AI技术叠加公司所擅长的安全防护能力。

　　3.3、逻辑3：有技术，世界前三，东亚第一的安全能力

　　类ChatGPT应用已经作为内部生产力工具使用。

　　2022年搜索引擎中国市占率第二（35%），同时三六零在数据资源端有丰富的多模态大数据积累和相关语料，尤其是中文语料，公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性投入，当前公司类ChatGPT产品技术指标超过ChatGPT2，在中文环境下使用效果超过ChatGPT2，在公司内部已经作为生产力工具使用，公司也计划尽快推出类ChatGPT技术的demo版产品。

　　AIGC技术还可以辅助数字安全能力的提升。360以世界前三的安全能力用于构建大模型，15年累计的东半球最大的安全数据库用于迭代优化，以及众多高水平安全工程师可以准确高效的进行安全数据人工标记、调参及数据清洗。若AIGC大模型在数字安全领域预训练完成，将给数字安全技术带来重大变革。

　　四、英伟达黄仁勋：人工智能时代的“iPhone时刻”（硬件最受益）

　　4.1、逻辑1：ChatGPT离不开背后庞大的算力支撑

　　根据绿色节能数据中心官方公众号，ChatGPT的总算力消耗约为3640PF-days。按近期在国内落地的某数据中心为参照物，算力500P耗资30.2亿落成，若要支持ChatGPT的运行，需要7—8个这样数据中心支撑，基础设施投入需以百亿计。

　　4.2、逻辑2：人工智能算力加速领域的NO.1

　　则正是目前人工智能算力加速领域的NO.1，其在去年4月发布的HopperH100，也是目前最强的人工智能GPU。

　　市场份额来看，NVIDIA一家占了79%的份额，之后再是AMD，占了20%的份额，两者合计占到99%，剩余的1%是的。

　　作为此前给矿工卖“铲子”的厂商，在加密货币的牛市期间，的GeForce显卡可谓是供不应求，并为其赚取了超乎想象的超额利润。

　　一位内部人士透露，ChatGPT推出前半年，公司内部几乎所有A100显卡的使用权限都被收回，各部门要运算模型只能使用算力相差数倍的V100显卡。

　　经过十余年的技术积累，为GPU的通用计算开发的并行计算平台和编程模型打造的CUDA生态，已经成为了在大型数据集上进行高效计算的最佳选择。

　　简而言之，对于有志于在人工智能领域有所作为的企业来说，购买的GPU都是第一选项。

　　五、投资风险

　　从中短期来看，ChatGPT虽然目前技术水平相对其他AI聊天工具更高，但仍未达到理想状态，就像莱特兄弟发明了飞机，到飞机成为常用的交通工具，还有很长的路要走；

　　ChatGPT的产品迭代及生态建立仍需一些时间，目前商业模式还不清晰，同时运营成本较高，对包括搜索引擎巨头在内的产业生态，预计暂时还不会带来实质性的颠覆。

　　ChatGPT仍处在产业发展初期，股票表现仍以事件驱动为主，同时受到宏观市场环境等影响，波动较大。投资层面上，除了基本面因素，也建议关注资金方面的因素，以辅助决策。

　　$翼虎成长23期(P666020)$ $翼虎成长18期(P666018)$ @雪球私募 @雪球基金 @今日话题 #ChatGPT概念还能炒多久# #人工智能# #文心一言#

<<“聪明的小孩”确实有“ChatGPT那味儿”

ChatGPT火了，周鸿祎委员：我看到了产研协同和开放生态模式的重要性！>>

ChatGPT，AI界的iPhone时刻

您可能还会对下面的文章感兴趣：

随便看看