裁掉人工，雇佣AI”，ChatGPT开始替代人类

network · 发表于 2023-2-5 06:56:33

裁掉人工，雇佣AI”，ChatGPT开始替代人类 2023-02-04 08:00

图片来源@视觉中国

文｜锌财经，作者｜陈妍，编辑｜大风

“一部电影的观后感包含哪些部分？”

“请根据这些要素，写一篇《流浪地球2》的电影评论。”

“能不能让文章变得更有文学性和可读性一点？”

只要在ChatGPT的聊天框里把自己的写作需求告诉AI，等上几十秒后，一篇整合大数据、纯原创、观点鲜明的文章就新鲜出炉了。

如果对成品还不满意，可以继续提自己需求，AI不会有任何不满情绪，将“任劳任怨”地修改内容，并且等待时间不会超过1分钟。仅仅推出几个月的聊天机器人模型ChatGPT，可谓是当代打工人之楷模。

ChatGPT截图

本以为科技的浪潮下，AI会先让保安、邮差等人力工种消失，没想到，是码字工们先没活干了。

近一年来，AIGC（生成式AI）发展速度惊人，去年年初还处于技艺生疏阶段，几个月后就达到专业级别，更迭速度呈指数级爆发。如今的AI，文能写诗、画画、搞创作，武能编码、分析、做高数，为用户带来超出预期的交互体验。

AIGC技术的热浪也打到了资本端，各大科技巨头都蠢蠢欲动。近期，微软宣布追加投资ChatGPT开发方OpenAI，并加速旗下产品和OpenAI相关AI技术的融合。百度也传出正在研发类似ChatGPT的聊天机器人服务。谷歌、字节、阿里等多家公司都宣称将在AIGC领域加大布局。

但大风之下，争议也随之而来。围绕AIGC技术的相关法律法规尚未完善，有关公平、安全、责任等一系列问题亟需解决。此外，AIGC技术是一场成本极高的烧钱游戏，可它的商业化价值仍在探索阶段，尚未实现落地。

AIGC或将无处不在

OpenAI发布的ChatGPT，一经推出就火爆全球，究其原因，还是它和无数人印象中“笨拙”的机械AI聊天工具完全不同。它不仅能分辨出提问者的真实诉求，甚至在很多领域超过专业人士的精准性和博识程度，在短时间内给出意料之外的回答。

应了一句话：ChatGPT能处，有事它真解决。

现代人类社会是趋于便捷、高效而发展的，因此，AI与人类生活和工作的紧密结合只是时间问题。AIGC的快速发展，会对人类社会产生不可逆的深远影响。百度创始人李彦宏曾对AIGC做出预测，“从辅助人类进行内容生产的助手阶段，到可以与人类协作的虚拟人形态，直至最后进化为可独立完成内容创作的终极形态。”

AIGC的热潮下，最先受到波及的大概就是媒体和出版行业。如今，借助AI语音生成软件，可以将采访稿快速以文字的形式输出，甚至可以实现跨语种的语音转写，辅助内容创作者快速出稿。机械重复、没有创意价值的文字工作已经被代替了。

随着ChatGPT等更高阶的AI机器人出现，原本属于记者、作家的核心创意工作，可能也要被AI取代了。毕竟，在聊天框内输入几个关键词，AI就能随即生成一篇几千字的小作文。比起抓耳挠腮没灵感的人类，AI机器人像一台灵感喷涌的永动机。

事实上，已经有企业尝试这么做了。前不久，“美版头条”BuzzFeed宣布使用ChatGPT来协助创作个性化内容。该公司CEO乔纳·佩雷蒂表示，人工智能主导的内容创作将从研发阶段转变为该公司核心业务的一部分。

也就是说，BuzzFeed要采用ChatGPT上岗写作，逐渐取代人类撰写。

这则消息迅速引发投资者热情，让BuzzFeed股价两天暴涨3倍。而在此之前，BuzzFeed正陷入营收困境，将员工队伍缩减12%来应对资金压力。平台靠着ChatGPT咸鱼翻身，何尝不是“裁掉人工，雇佣AI”的一次胜利。

文本创作只是最基本的能力，AIGC还能当计算机专家，给程序员的代码找bug。曾有网友提交了一串代码，向 ChatGPT表示，“我怎么都搞不懂这段代码为什么无法运行。”而ChatGPT不仅详细地解释了缘由，甚至针对其技术问题，贴心地提供了解决方案，比一些搜索引擎里的回答还要靠谱。

图片来源：@jdjkelly

感慨其强大能力同时，也不禁产生更多忧虑：AI逐渐成为代码高手，距离程序员集体下岗还有多远呢？

随着人工智能技术不断发展，AIGC在各行各业中的应用正不断增加。在设计和绘画领域，它可以一键生成设计草图、图标；在商业领域，它可以凭借大数据，生成竞品分析，撰写经营报告以及其他业务文件；在教育行业，它能生成教学资料、测验和课程内容……

AIGC逐渐渗透到社会的方方面面，在潜移默化中改变了人类生存方式。

别被AIGC骗了

尽管AIGC的强大功能已经刷新了人们认知，但不可否认的是，目前它仍存在很多局限性。对当前的AIGC技术，需保持警惕。

正如OpenAI所强调的，ChatGPT可能会给到你错误的答案。AIGC的发展速度超过想象，但目前人工智能算法方面还存在缺陷。尤其是面对一些常识类问题，用户可能会被AIGC提供的答案误导。比如，ChatGPT在写《流浪地球2》影评时，一本正经地表示，“《流浪地球2》是2019年的热门电影的期待续作，由冯巩执导。”

ChatGPT截图

ChatGPT还会装作权威的样子“胡说八道”。它习惯于用大段大段繁杂的文字回答用户的问题，看似自成一套逻辑，但细想下来漏洞很多，结论也不成立。假如在一些专业性问题上轻信了AI提供的答案，可能会出岔子。

前段时间，IT问答网站Stack Overflow反手就把ChatGPT“拉黑”了，给出的理由是，ChatGPT生成答案的正确率太低，发布ChatGPT创建的答案对网站和用户都是有害的。

由于操作便捷，Stack Overflow上曾一度涌现出大量ChatGPT生成的答案。而这些答案通常需要具备一些专业知识的人详细阅读才能辨别对错，导致Stack Overflow 的质量管理遭到冲击。

除去技术自身存在的问题，有关AIGC的相关法律、法规没有完善，用户的使用界限也还没有确立。

此前ChatGPT通过法律与商业研究生考试一事也引发热议，不少人担心ChatGPT会帮助学生在考试中作弊。在国内视频网站上，已经能找到大量“利用ChatGPT帮助生成一篇论文”的教程，一个视频动辄几十万的播放量、上万的收藏量，很难不让人怀疑，已经有学生进行过实操。这些问题得不到妥善解决，教育的公平性则无从谈起。

视频网站截图

AI科技公司也意识到类似问题，开始采取行动“压制”AIGC的野蛮生长。近日，OpenAI推出一款AI鉴别工具，用来识别AI生成的文本内容。但目前该工具还不成熟，AI写的文本很容易就会躲过监测。

而更令人担忧的是，AIGC技术被用于违法犯罪活动，给整个社会带来更大的风险。

如今，AI换脸、AI克隆声音等技术逐渐成熟，甚至到了真假莫辨的程度。这样一来，就可能发生：朋友打视频电话来借钱，转款成功后才发现，屏幕对面的“朋友”是利用AIGC技术生成的虚拟影像，而骗子早已逃之夭夭。

比较著名的案例是，诈骗团队利用AIGC换脸，伪造特斯拉CEO马斯克的视频，半年诈骗价值超过2亿人民币的数字货币。

AIGC浪潮背后，还有很多问题需要解决。

赛道火热，巨头入场

必须要承认的是，近一年来AIGC的快速更迭，让它站在了资本的心尖上。科技巨头们纷纷入局，AIGC初创平台不断涌现，国内外市场都表现出对AIGC的狂热。

去年10月，英国开源人工智能公司Stability.AI宣布获得1.01亿美元融资，投后成为估值超10亿美元的独角兽；几乎同一时间，另一家主打文字生成的AI公司Jasper也宣布获得1.25亿美元的新融资，估值达到15亿美元。

国内百度在今年1月的Create AI开发者大会，重点提到了AIGC。此前百度曾和视觉中国签署战略合作协议，旗下的AI绘画平台文心一格将与视觉中国合作探索AIGC内容产业发展方向。而6pen、滴墨社区、无界版图等AIGC初创平台背后，也均有大厂身影。

根据投资界预测，未来两三年，与AIGC相关的初创公司和商业落地方案将持续增加，等到2030年，AIGC市场规模或将超过万亿人民币。

但硬币的另一面是，AIGC背后的企业尚未实现大规模商业化，AIGC领域还没有构建起自己的护城河。

迄今为止，Stability.AI是一家并未专注商业化的新兴公司，还在把免费提供其主要检查点作为核心业务宗旨。而OpenAI旗下的ChatGPT仍在免费开放，通过海量用户反馈加速模型迭代。OpenAI首席执行官萨姆·奥特曼近日表示，“我们将不得不在某个时间点，以某种方式将其商业化，因为运算成本令人瞠目结舌。”

OpenAI处于严重亏损之中。据媒体报道，去年该公司预计收入3000万美元，但净亏损总额超5亿美元。用户与ChatGPT每次对话的平均费用可能只有几美分，但随着使用规模变大，计算成本可能将飙升至数百万美元。

AIGC技术在短时间内恐怕会面临更多争议和前行阻碍，但长远来看，AIGC已经改变了游戏规则，人类正走向科技颠覆的新世界

network · 发表于 2023-2-10 15:54:39

ChatGPT编年史

我们来梳理一个时间轴。ChatGPT是对话式UI + GPT–3.5系列模型，我们以最具代表性的论文、模型、API为主线，梳理到今天。

2020之前

2017年6月，Google发布Transformer论文。
2017年6月，7月，OpenAI发布人类喜好的强化学习算法、PPO算法，都是ChatGPT用到的算法。
2018年6月，OpenAI发布GPT-1.
2018年11月，Google发布BERT，此后NLP领域主要基于这个框架研究下游任务。
2019年2月，OpenAI发布GPT-2，OpenAI获得了自信，此后专注于GPT.

2020年

年初，Covid-19爆发。中国biguan。
1月，OpenAI发布语言模型的Scaling Law（概念：模型能力跟参数规模、数据规模强相关），OpenAI获得了在数据和参数规模上Scaling-up的信心。
5月，GPT-3论文发布。
6月，GPT-3 API发布。
9月，ChatGPT的关键原型算法相关论文发布。
12月，欧洲机构发布用于GPT-3复现的开源数据集。

2021年

7月，OpenAI发布Copilot原型算法。
8月，Codex API发布。
11月，GPT-3 API Public Release，。

2022年

1月，GPT-3.5 API (text-davinci-002)发布，该模型经过Github代码的训练加持，推理能力显著提升（该假设的因果关系待学术界论证），经过Alignment技术的加持，Follow人类指令的能力显著提升，输出结果有用性和无害性显著提升。
3月，GPT-3.5论文发布，公开Alignment算法。
5月，OpenAI Codex已经被70个应用使用，包括微软收购的Github的Copilot.
8月，Stability AI开源StableDiffusion，文生图的算法的效果可用、速度可行、代码开源同时发生，引爆图片生成。一时间，在中国，AIGC似乎就是图片生成的代名词。
9月，Sequoia Capital发布Generative AI: A Creative New World博客。
中国研究人员和开发者，没有OpenAI的API权限。但图片生成却人人都可以尝试，于是互联网似乎只注意到了图片生成，对GPT大语言模型的关注度进一步下降。
经过接近一年的API接入和UI探索、近一年的思维链（Chain of Thought）等Prompt Engineering技术试错、模型加速等技术（如Flash Attention、Fixed-Point）带来的成本和延迟下降，GPT-3.5的模型潜力得到开发（变得Better、Faster and Cheaper）, Copy.ai, Jasper等文本生成类公司的产品逐渐成熟。
11月，OpenAI发布GPT3.5 API的新模型(text-davinci-003).
12月1日，ChatGPT发布。Musk等名流开始谈论ChatGPT，引爆英文互联网。
12月初，中国互联网的自媒体逐渐开始讨论ChatGPT，主要以翻译twitter的方式。知乎上有学者开始反思。一周后，关注指数下降，两个月来只剩下AI自媒体把ChatGPT作为自己的主要关注内容。
中国BIGUAN。

2023年

1月，微软宣布投资OpenAI数十亿美元，并将GPT加入全家桶。
2月，中国春节结束，微软和Google你方唱罢我登场，纳斯达克财报季，AI被反复提起。中国互联网是认识微软的，ChatGPT引爆中国互联网，关注指数飙升。
中国开放。

值得注意的是，中国因为疫情闭关的三年，正是OpenAI的GPT发展、壮大、产品化的三年。

我们如何CUOGUO GPT盛宴？

历史回顾完了，那么为什么我们（中国，尤其是AI社区）没有更早地意识到，OpenAI技术在应用层面的突破性？

意识到问题需要同时具备哪些条件：

能够看且懂OpenAI、DeepMind、Google等机构的论文（代表人群：研究员）
能够使用OpenAI的API探索论文里的模型（代表人群：研究员里的尝鲜者）
对硅谷的敏感性，经常看大家在用OpenAI的API做什么产品（代表人群：VC）

这三类人在中国，我们粗估一下，第一类，大概有1/100,000，第二类大概是第一类里的1/1,000，第三类大概是1/1,000,000. 三个条件，缺少一个，都无法意识到OpenAI发展到哪一步了。有哪个团队汇集了这三种人，并且他们有充分的碰撞？有哪个人是具备了这三种属性？雪上加霜的是，研究人员三年来被封在国内，没有出国参加过学术会议交流，甚至我猜很多人连线上会议都没有参加，很多东西我们从论文上是看不到的。

我们继续深挖。第一类人群中，又分成NLP（自然语言处理）研究人员，其他AI研究人员（比如计算机视觉、语音识别、机器学习）。

中国NLP的研究群体里，基本上是把语言模型（尤其是BERT，而不是GPT）拿去应用在NLP的各种下游任务上，在学术界就是刷榜发论文，在工业界，就是拿去做客服机器人、写稿机器人、角色扮演机器人，研究方法也完全不同于GPT精髓——Scaling-up和Alignment。（几乎）没有人是把大语言模型（LLM）当做通用人工智能（AGI）的一种可能性来研究的。

其他AI研究人员，比如计算机视觉，大部分人还是专注在图像上，即使是用Transformer，也是解决图像的问题，比如用Transformer来做自动驾驶、图像生成等。即使是Tesla AutoPilot的AI主管Karpathy。Karpathy在2022年上半年从Tesla裸辞，以独立研究员的身份，投身于大语言模型。

Karpathy曾经说他过去十年痴迷于AI中取得最快进展的方向，并且曾经对语言模型非常感兴趣，但是却忽视了scaling up的力量，那就是简单的Objective（next word）+简单的结构（Transformer）+ 足够的参数+足够的数据(web text)，一个语言模型可以涌现出在小规模状态下看不到的能力，他曾像其他人一样（他应该指早期的OpenAI），一度以为强化学习是AGI的路径，到头来却发现大语言模型是看起来最有希望的路径。在此之前，语言模型的研究人员，把精力过多地放在了具体任务上。

再说AI领域的另一个重要群体——计算机视觉（Computer Vision)群体。在2012年开始的深度学习浪潮里，计算机视觉一直是应用最广、商业化最成功的方向，吸引了太多AI研究员的精力，从图像分类、检测、分割到识别，从图像到视频，从高层视觉到底层视觉，我们在卷积神经网络上卷出了一个又一个新高度。一个YOLO目标检测框架，被迭代到原作者都放弃了，还有人给推到了v7版本。最具代表性的是计算机视觉的登月工程——自动驾驶，它需要成像、识别、合成、建图、规划等几乎所有的视觉AI技术加持，从CNN时代到Transformer时代，不断地拉更多的人下水，但直到今天，全自动驾驶的方案仍未收敛。马斯克定义的问题是对的，自动驾驶是一个real-world AI问题，但显然特斯拉的方案并没有为全自动驾驶准备好。

NLP圈的小家碧玉，CV圈的隔行隔山，疫情闭关三年，互联网信息不通。这些因素叠加起来，整个中文世界，形成了一个信息茧房。10年来，我们以为自己积攒的AI算法、数据、应用的优势，如今变成中美巨大的鸿沟。这个时候，我们甚至没有一个新闻调查，把这件事的来龙去脉，挖它个底朝天。

另一个问题是，我们的中文互联网不足以提供高质量的训练数据。什么是高质量的数据？比如维基百科、高质量的活跃论坛、专业新闻、学术论文、高质量代码、图书。

我们看看GPT–3的训练数据是什么。权重最大的数据集是OpenWebText（开源版本）,数据是从Reddit论坛上收集的URL，再把内容抓取下来。Common Crawl是一个开放的互联网数据存档（英文占一半，中文大概5%）。其他一些代表性的数据包括Wikipedia维基百科，Books开放图书，Stack Exchange技术问答社区，Github 代码，ArXiv论文，RealNew新闻存档，PubMed医疗数据。可以看到，由中文互联网产生的数据，比例低到可以忽略。这也是困扰很多试图训练中文大模型的问题，但实际上，ChatGPT的用中文沟通的能力，已经远超那些专门的中文大语言模型了，背后原因是GPT隐式学到的翻译能力。

没有好的中文数据，我们就只能搭全球互联网的数据顺风车。上面这些优质数据的产生，需要开放的社区，我们似乎无解。

GPT大语言模型能实现AGI吗？

基于GPT的LLM，仅仅依赖语言，大概率无法实现AGI，而只是”通往AGI的高速公路的一个出口（Yann Lecun）“。但LLM足以把互联网基础设施搞个天翻地覆，它同时具备了Logic和Memory。Logic是推理能力，Memory是对高频知识的记忆，显然Memory可以分为片上和片外，片上有限，片外无限。下一步，我们只需要专注于把LLM的Logic推到极致，把大部分低频Memory offload到模型以外，配以搜索等查询技术，就可以实现对整个互联网前后端的重构。我们远远没有吃尽scaling-law的红利，限制我们的，只有集成电路的摩尔定律和制造能力、能源的价格、数据的获取。

集成电路方面，以Chiplet为代表的系统摩尔定律还不够，人们需要能够scaling-up的Foundry。

能源方面，太阳能和风能 + 能源存储能够解决很多问题，更加激动人心的是以Helion为代表的核聚变技术，则有机会把能源价格降低一个量级，然后更多。

数据方面，目前的GPT模型依赖互联网文本数据，这会用尽，没关系，现实世界的数据是无限的。

连载话题预告

今天先写到这儿。

计划中：

OpenAI的故事
AI Alignment
AI与资本主义
AI与教育
AGI时代的人

By 红博士, 2023年2月8日

账号		自动登录	找回密码
密码			注册