正如人类历史上无数次科技创新所展示的那样,爆炸式创新、现象级产品总是突然地、从人们未曾预料的地方冒出来。2023年初最“出圈”的科技新词非“ChatGPT”莫属,最近一周,它的服务器访问量始终处于满负荷状态(2月5日本报第三版“热点聚焦”刊登报道《ChatGPT火热“出圈”,我们如何应对新挑战》)。
有人将人工智能(AI)比喻为飞驰的列车,人们只有一秒钟与它擦肩而过,之后它就呼啸着离人远去,“擦肩”寓意AI与人类的智力水平相当之时。如今,ChatGPT的火爆程度已无需用语言描述,人们更想知道我们已经到了与呼啸列车“擦肩”的时刻了吗?
“简单粗暴”更胜一筹?
(资料图片)
同一理论基础,两条技术路线
在ChatGPT爆火之前,AI领域的翘楚当属谷歌,不仅论文发表数量最多,其对思维链路提示、大模型涌现现象的研究也走在前列。从技术路线看,谷歌所推出的各种大模型和OpenAI推出的ChatGPT都源自2017年AI领域的一篇重磅论文《一种采用自注意力机制的深度学习模型Transformer》,但在模型构建上,两者选择了不同的技术路线。
中国计算机学会术语工委副主任、同济大学特聘研究员王昊奋表示,谷歌采用的是理解与生成相结合的路线,在编码端投入更多精力,以便让机器理解输入内容的意图和情感,也就是先理解再生成,这似乎更接近于人脑的工作模式。而OpenAI团队则认为,“如果机器能够输出内容,那么它肯定能理解这些内容”,于是舍弃了编码端的工作,专注于解码,即让机器生成人可理解的内容。相比谷歌,OpenAI的模型显得有些“简单粗暴”。
从目前的结果来看,似乎是“离经叛道”的OpenAI暂时领先于“名门正派”的谷歌。ChatGPT已经成为史上用户增速最快的消费级应用程序,推出仅两个月便突破了一亿用户,对于以数据和应用驱动的AI产业来说,更多用户意味着更多数据、更多应用场景和更多训练。
非线性增长突变如何发生?
消化全球互联网2/3文本语料
王昊奋曾问过ChatGPT所依赖的大规模语言模型GPT-3这样一个问题:“我能请猴子来装修房子并付给它们工资吗?”GPT-3的回答是“可以”。同样的问题交给ChatGPT,它的回答是“不行,因为它们是动物”。王昊奋说:“基于OpenAI选择的技术路线,我们尚无法从理论层面解释这究竟发生了什么。”
有专家认为,ChatGPT横空“出圈”或许是基于模型规模方面的“大力出奇迹”。复旦大学计算机科学技术学院教授邱锡鹏表示,以前人们认为语言模型的能力增长是线性的,参数规模越大,规模带来的边际效益会越来越小;ChatGPT则向人们展示了另一幅图景:当模型规模大到一定程度时,其能力突然迎来了一个非线性的增长突变。
GPT-3是一个拥有1750亿参数、利用45万亿字节文本数据进行训练的AI算法模型。由于OpenAI关闭了接口,因此无法得知ChatGPT的规模大小。但根据它训练好的参数量、单词量和使用数据源等信息反推,业内估算,ChatGPT已经消化了全球互联网2/3的文本语料。
聊天机器人何以谈颠覆?
或开启自然语言对话界面时代
就功能而言,ChatGPT似乎并没有多少创新性可言。你可以把它看成一个聊天机器人,微软小冰、天猫精灵以及苹果的SIRI,早已经出现在我们的生活中。
但为何ChatGPT能够一鸣惊人?王昊奋认为,ChatGPT有两个突出特点:一是它是个全语言模型,任何人都能用母语对它提问;二是它是个全场景模型,不管是写论文、编代码还是单纯求一碗“心灵鸡汤”,它都能胜任。“过去几乎所有的大模型都是根据有限场景去做的,ChatGPT的通用性让大家意识到,这可能是走向通用AI的一条道路。”
ChatGPT的出现,在产业界引发了一场“地震”,其竞争也日趋白热化。谷歌已经宣布将基于旗下LaMDA模型推出竞品Bard(巴德),百度、阿里、字节跳动等国内企业也纷纷宣布即将推出类ChatGPT产品或拥有类似技术积累,甚至老牌搜索企业雅虎也期望借助它重回主流视线。
全球顶尖互联网企业从ChatGPT的火爆中“嗅”到了什么?王昊奋的答案是“接口”。过去,我们在不同场景中借助不同软件与虚拟世界相连,这意味着我们还处于图形界面用户时代;未来,ChatGPT有望将我们带入自然语言对话界面时代,就如钢铁侠拥有了AI助手贾维斯。
腾讯研究院研究员胡晓萌认为,ChatGPT的火爆并非昙花一现,它的出现已致底层技术和产业生态形成新的格局,AI技术正从感知、理解世界跃迁到生成、创造世界,AI的下一个时代正在到来。
中国的机会在哪里?
丰富文本语料,完善AI飞轮
谷歌搜索显示,目前全球讨论ChatGPT最热的地方就在中国,国产版本何时诞生是人们最关注的话题。这或许是因为在AI领域,中美是最有资格掰掰手腕的两个国家。根据去年发布的《2021全球AI创新指数报告》,中美两国处于AI领域的第一梯队,中国距离美国的差距正不断缩小。胡晓萌表示,在与ChatGPT相关的核心技术方面,我国有着前期积累,业内统计我国千亿参数以上的大模型占全球1/3,美国占1/2。这也就不难解释,为何百度能如此迅速地拿出类ChatGPT产品。专家预计,年内国内至少有四五款同类产品即将上线。
不过,王昊奋认为,想要达到ChatGPT的水准,国产竞品还需突破三大难点:一是要丰富文本语料的规模,中文文本数据量和质量与英语语料之间差距较大;二是要加大数字基础建设,加大面向多机多GPU或类GPU的高效分布式训练框架的投入;三是要强化模型的持续更新和对用户反馈的收集与利用,完善AI飞轮。
ChatGPT的惊人表现引发了人类被AI加速替代的恐慌,王昊奋认为对此不必过度焦虑。在他看来,ChatGPT的出现,相当于当年苹果推出了iphone或者谷歌推出了搜索引擎,“这只是一款工具”。未来,人们将在这款新工具的基础上叠加各种应用,也会产生各种新的工种。这意味着,一些旧的机会将会消逝,更多的未来空间将浮现在眼前。
作者:沈湫莎
编辑:范菁
图片:视觉中国
正如人类历史上无数次科技创新所展示的那样,爆炸式创新、现象级产品总是突然地、从人们未曾预料的地方...
城管向商户收防疫保证金官方通报今天的热度非常高,现在也是在热搜榜上了,那么具体的城管向商户收防疫...
百度如何刷关键词,百度如何刷关键词?目前来说,是可以通过一些工具去刷关键词。但同时相对来说,也需要...
2022年7月,《重庆市培育新时代建筑企业自有工人队伍试点工作方案》印发,明确自2022年12月1日起,全面...
鹿丸表白手鞠多少集,第一次56集是中忍考试鹿丸VS手鞠、124-125集是鹿丸一队人去追佐助时,鹿丸对音忍者...
内容来源:脉脉MAX中国职场力量盛典。分享嘉宾:樊登,樊登读书App首席内容官。轮值主编|智勇责编&值班...
今年清明节假期,全国收费公路将继续免收小型客车通行费,具体免费时段从4月3日0时至5日24时。普通收费...
1、词义:形容事物很风行,像风吹倒草木一样 出处:言出风靡,会行景从。2、——《三国志·贺邵传》 ...
中文名:黄海冰英文名:曾用名:黄鳝民 族:汉族国家地区:中国内地出生日期:1973-7-23出生地:上海...
1、国家安全的基本内涵就是国家领土安全,国家领红安全,国家领海安全以及国家信息安全。2、国家反恐安...
江西新闻客户端讯(江西日报全媒体记者殷琪惠)近日,记者从省市场监管局了解到,自我省涉疫药品和医疗...
1、野兽之灵-乌迪尔2、基础介绍:3、物理攻击:64、魔法攻击:55、防御能力:86、上手难度:77、购买价...
2023年2月9日,大洋电机发生1笔大宗交易,总成交347 43万股,成交金额1782 32万元,成交价5 13元,折价9 20%。
多省市密集出台稳楼市政策,广东,多省市,房地产业,稳楼市政策
2月9日富时中国A50指数期货现跌0 26%,富时中国,指数期货
1、将U盘插入电脑的USB接口。2、等待电脑运行U盘,打开“我的电脑”可以看到插入的U盘。3、找到需要存入...
1、95分享网是中国最大的分享论坛。2、于2012年6月6日成立。文章到此就分享结束,希望对大家有所帮助。
排名对大学科研教学水平提升、形象推广与其在与国际合作对象的行销上,有着深远的影响。以下是小编为您...
1、Averageseektime平均寻道时间是指硬盘磁头移动到数据所在磁道时所用的时间。2、单位为毫秒(ms)。文
消极意思是指阻碍发展的,不求进取,消沉。关于消极的近义词和反义词大家知道有哪些吗?下面是小编为大家...
X 关闭
X 关闭