预训练大模型是什么 目前阶段大模型产业的特征是什么?
预训练大模型是什么?
所谓的预训练大模型,是指在大规模宽泛数据上进行训练的基础模型。它抓住了深度学习算法数据越多模型鲁棒性越强的基础特点,对模型进行暴力地“数据投喂”。经过大规模数据的预训练后,模型可以适应更多种类、更为复杂的下游任务,从而最终获得更好的智能体验。
大规模预训练模型,其实并不是一种技术路径上的创新,而是更接近把握技术特征之后的工程创新。大模型之路被广泛认可,开始于谷歌在 2018 年 10 跃发布 BERT。它利用 BooksCorpus 和维基百科的大规模数据进行模型训练,在 11 个下游任务上刷新了当时的业界纪录。
我们可以将大规模预训练模型理解为一种“预制菜”。既然用户自己烹饪的难度太高,费工费火,那就不妨由商家先行预制。用户将菜买回后加热一下,加入自己喜欢的调料就能上桌食用。大模型的思路也是如此,它通过上游进行模型预训练,下游进行任务微调的方式来使更多产业能给应用到效果好、质量高的 AI 模型。
目前阶段大模型产业的特征是什么?
目前阶段,大模型产业的特征是那些直接对标 GPT-3 的大模型项目依旧占据主流,或者说并没有给出太多有说服力的超越价值。同时,新的大模型技术思路与产业转型思路也已经开始出现。这正是白垩纪的特点:恐龙和哺乳动物共处一地,而新生物种正期待着更多变化到来。
推荐
-
我国在西昌卫星发射中心发射长征二号丁运载火箭 成功将遥感三十六号卫星送入预定轨道
从中国航天科技集团获悉,9月26日21时38分,我国在西昌卫星发射中心发射长征二号丁运载火箭,成功将遥感...
来源:科技日报 -
东南亚电商巨头大规模要求被裁员工赔偿电脑损伤 苹果电脑2500起
网传东南亚电商巨头 Shopee 公司大规模要求被裁员工赔偿电脑损伤,苹果电脑都是 2500 起,Shopee ...
来源:凤凰科技 -
与亚马逊Audible展开竞争 Spotify在美国推出有声读物服务
已在美国推出有声读物服务,此举欲与亚马逊的 Audible 展开竞争。Spotify 称,用户可在 Spotify Ap...
来源:TechWeb -
YouTube视频网站中“不感兴趣”按钮几乎没有任何作用 类似相关视频还会出现
有一项新的研究发现,即使用户对 YouTube 中某些类型视频选择了不感兴趣,但是类似相关的视频还会出现...
来源:凤凰科技
直播更多》
-
鼓励更多退役军人投身经济建设主战场 中山市帮退役军人实现高质量就业创业
中山市在加大政策落实力度、提升创新创...
-
鼓励更多退役军人投身经济建设主战场 中山市帮退役军人实现高质量就业创业
中山市在加大政策落实力度、提升创新创...
-
提升全自动化集装箱码头作业效率 全智能港口系统落地青岛
山东省港口集团有限公司(以下简称山东港...
-
美国麻省理工学院开发出无电池无线水下相机 能效比其他海底相机高出约10万倍
科学家估计,超过95%的地球海洋从未被观...
-
新建改造通信宏基站95座 广西南崇高铁5G网络建设忙
连日来,中国铁塔广西分公司的工作人员...
-
龙族大战指环王 流媒体迈入大片时代
当流媒体迈入大片时代,拼实力的时候到...
资讯更多》
焦点
- 全国古树名木保护科普宣传周启动仪式 近日在北京国家植物园举行
- 中国石油集团组织专家 对兰州石化长庆乙烷制乙烯项目智能化工厂建设工作进行验收
- 罕见钻石“讲述”水的故事 地球660公里深处或存在矿物结合态水
- 培育数据要素市场 河南省发布大数据产业发展行动计划
- 如果能够重新来过 马斯克或不会将首家欧洲工厂设在德国
- 补齐训练短板 科学组训助力猎鲨海天
- 厦门国家火炬高新区专精特新企业培育项目开班 50名备企业高管开启研学之旅
- 为禁捕退捕装上“数字眼” 中国联通助力长江黄河流域水域治理
- 顺丰同城寄丢20克黄金保价8000元只赔2000元 当事人质疑保价意义何在
- SK明年将在韩国投资73万亿韩元提升产能 未来5年还将投入25万亿韩元