当前位置:首页>滚动 > >正文

大模型「涌现」的四个关键_天天快看点

  • 2023-04-12 14:23:22来源:商业新知网

作者 | 吴鸿键


(相关资料图)

“最近大模型的涌现,比大模型能力的「涌现」都要快。”

「涌现」是一个专业概念,放在大模型的语境里,指的是模型在突破某个规模时,出现了意想不到的能力。这话虽然是调侃,但也高度概括了行业现状。

ChatGPT在全球掀起热潮以来,国内已有多家公司发布或将发布自己的大模型,这些公司中既有阿里巴巴、百度、京东、华为等互联网或科技大厂,也有以商汤为代表的AI公司,以及备受瞩目的初创企业(例如王慧文的光年之外,王小川的百川智能)。

如果再把科研院所算上,据民生证券的统计,国内目前已有超30个大模型亮相。行业俨然有大模型“军备竞赛”的意思。

“混战”本身说明了不少事情,比如各家都已认识到大模型的价值,试图通过大模型升级已有业务和打开新增长空间。即使人们普遍认为大模型门槛高,但“百花齐放”也折射出业界认为大模型的发展尚处早期,且并不是只有极少数大玩家才能参与的游戏。

机会看上去很多,但拨开冗杂的信息,我们需要判断,大模型的“涌现”是不是昙花一现?以下四点值得关注。

产业融合成共识

相比ChatGPT在用户端的热潮,国内厂商更愿意谈大模型和产业的结合。“客户”是高频词,“接入我们的大模型”是共同目标。

以阿里巴巴的通义大模型为例,近期,阿里云官宣自研大模型“通义千问”并面向企业开始邀请测试,在阿里云峰会上,包括张勇在内的阿里云高管频频强调大模型能为各行业企业带来的价值。据阿里云智能CTO周靖人介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。

早些时候发布“文心一言”的百度,也是将B端“生态圈”作为宣传和业务重点。华为云盘古大模型提出了“AI for Industries”理念。推出大模型“日日新”体系的商汤,更是只面向政企客户开放API。

大环境对于生成式人工智能服务相对谨慎的态度、企业各自的资源和能力禀赋、以及在C端体验上和ChatGPT的差距,都可能是造成差异的原因。上述案例的共性是,大模型对于各家企业并非一个“另起炉灶”式的新业务,而是对已有业务方向的延伸和突破,对大模型的理解依然要放在公司已有的业务发展框架里来看。

依然以阿里云为例,云计算公司容易陷入“低毛利集成商”困境,难以在标准化和定制化之间找到平衡。预训练大模型带来了新的可能——在阿里云方面的设想中,企业只需将数据放在专属数据空间,用于大模型自动学习,然后就能生成企业专属的大模型。相比原本“什么都要从头做”的业务模式,大模型提供了效率更高的选择。

扬长避短,各秀肌肉

目前,国内的大模型厂商并不讳言和OpenAI、ChatGPT的差距,只是各家对于“差距有多大”有一些不同的判断。

相比OpenAI,国内互联网大厂有成熟的业务矩阵,多元的能力架构,以及在多年实战中锻炼出来的差异化能力,因此大公司们愿意强调的能力和方向也有所不同。

例如张勇在云峰会上表示,阿里巴巴所有产品未来都将接入“通义千问”大模型。此举意在利用大模型升级甚至改造现有业务体系,阿里云方面将这种融合视为未来发展的关键,称“阿里巴巴和所有企业都在同一起跑线上”。

除了拿自家业务当试炼场,阿里云还在峰会上提及其他优势,比如指出大模型的研发不是简单的“堆叠算力”问题,强调阿里云在低碳低能耗方面的能力积累。这也是阿里云提出为企业打造专属大模型的重要原因。

百度的优势来自其在中文搜索引擎的领导地位,因此公司在发布文心一言时,着重强调了其“更懂中文”的特性。商汤则更多强调其在参数和算力上的优势。“日日新”体系包含自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar),其中“商量”参数约1800亿。商汤方面还强调,SenseCore大装置已完成2.7万块GPU的部署,并实现了5.0 exaFLOPS的算力输出能力,最高可支持万亿参数超大模型的训练。

除了应用,在和大模型相关的芯片和框架方面,国内大公司也有现成的积累。百度有昆仑芯、深度学习框架飞桨,华为有昇腾310和910芯片,ModelArts平台。这些同样是大厂在发展大模型时着重利用的对象。

大模型不稀缺,

高质量数据才稀缺

大模型“混战”还反映了一个信息:至少从表面上看,大模型不再稀缺。

民生证券在研报中指出,因为有开源基础以及大公司自本身的算力储备和资金实力,“单纯发布一个大模型的门槛没有市场想象中的那么高”。

“有大模型”不难,难的是“有一个能持续迭代,性能不断提升的优质大模型”。一些观点也提到,决定大模型发展的关键要素是高质量数据,尤其是在大模型“百花齐放”的背景下,数据是“胜负手”。

数据、算法、算力是AI能力三要素。

高质量的数据是助力AI训练与调优的关键,在和数据相关的流程中,数据采集、数据标注和数据质检又是较为重要的三个环节。但相比大模型的热闹,目前国内的数据相关产业链还有不小的提升空间。

据“自象限”的观察,目前数据质量在国内尚未受到足够重视,缺乏专门做数据质量的企业,这类企业更多是以大公司附庸品的形态出现。

而在海外,数据质量形成了垂直赛道,其中的公司会帮助AI企业最大限度地减少劣质数据带来的影响,这类公司产品通常包括数据可观察性平台、数据整理和偏见检测工具,以及数据标签错误的识别工具等等。

到底需不需要这么多大模型

最后是一个灵魂之问:行业需不需要这么多大模型?或者说,在大厂相继发布大模型的背景下,新玩家还有没有加入混战的必要?

大佬们对此有不同的看法。早些时候李彦宏在接受采访时表示,现在国内大厂都看好AI大模型,创业公司重新做没有多大意义。相较而言,“基于大语言模型开发应用机会很大,没有必要再重新发明一遍轮子”。

并不是所有人都认同这一观点。根据“品玩”的采访,王小川认为“大模型就是需要时间长一点,认真一点,而钱也不是唯一重要的”,“有些公司虽然有大模型这个底子,但没碰好就练歪了,上战场更难受。”

由于大模型的门槛和不确定性,留给中小厂商以及创业公司的难题还有很多——规模跟不上大公司的节奏,中模型或小模型难以找到竞争点,也难以获得“涌现”机会。如果选择垂直场景切入,又有可能遭遇来自通用大模型的“碾压”,一如ChatGPT对Jasper.AI的冲击。

大部分关于这类问题的讨论,比如要不要做大模型,要做什么样的大模型,要选择什么样的场景来落地等等,目前都还处于“混沌”状态。不少人在表达观点时还会特意强调“就目前的情况看”,并表示自己未来可能会在观点上有摇摆。但行业普遍认为,大模型代表着大机会,最后只有少数玩家能留下。

标签:

延伸阅读

推荐阅读

大模型「涌现」的四个关键_天天快看点

是诸神之战还是又一场大跃进?

逆转晋级!湖人加时擒狼进季后赛战灰熊 詹眉54+25 环球热推荐

逆转晋级!湖人加时擒狼进季后赛战灰熊詹眉54+25,湖人,明尼苏达森林狼队,孟菲斯灰熊队,新奥尔良鹈鹕,卡尔唐斯

基于Mo衬底电极的钙钛矿太阳能电池TCO可以被替代_天天新视野

中国科学技术大学徐继贤等人有了以下方面的发现:(i)不同钙钛矿 金属(铜、金、银和钼)界面的复杂化学反应和促进降解过程,这些反应与固有

【全球速看料】乌拉特后旗气象台解除寒潮蓝色预警【IV级/一般】

乌拉特后旗气象台解除寒潮蓝色预警【IV级 一般】

一季度台湾出口跌破千亿美元 金融海啸以来最大跌幅 全球聚焦

华夏经纬网4月12日讯:据台湾“中时新闻网”报道,台当局财政部门11日公布海关进出口贸易统计,3月出口额为352亿美元,年减19 1%,连续7个月负

银保监会发布2022年度保险公司偿付能力风险管理评估结果 世界快看点

证券时报e公司讯,2022年,银保监会对70家保险公司开展了SARMRA现场评估,其中产险公司27家,寿险公司31家,再保险公司8家,集团公司4家。整体

第一批“阳”的人,已经不再戴口罩了,但医生建议这3类人还得戴 当前速讯

随着新冠病毒的演变和疫苗接种计划的实施,专家们对疫情高峰和口罩使用的问题提出了更新的观点。本文旨在向您介绍这些最新的看法,以帮助您和

世界热推荐:瞬态时间

1、瞬态时间(Transienttime)指乐曲(特别是打击乐)中那些短暂而有爆发性的声音,通常,这些声音是难

天天速看:Linux:进程模型和进程管理

在Linux系统中,执行一个程序或命令就可以触发一个进程,系统会给予这个进程一个ID,称为PID,同时根据触发这个进程的用户与相关属性关系,基

焦点消息!酒精可以喷在床单上杀毒吗?

床单上喷酒精可以消毒。但不宜采用这种方法,消毒时针对病原菌进行消毒,床上被病原微生物污染的可能性极小,因此无需消毒,定期做清洁卫生,如确定

我国首条“西氢东送”管道纳入国家规划,意义何在?-环球讯息

我国首条“西氢东送”管道纳入国家规划,意义何在?---据中国石化消息,“西氢东送”输氢管道示范工程已纳入《石油天然气“全国一张网”建...

骗我钱的被抓了,咋让他还钱?|环球新消息

骗我钱的被抓了,咋让他还钱?

播报:平台上预约洗牙为何要登记身份证信息?阿里健康:正核实反馈

最近,市民黄先生向新民晚报“新民帮侬忙”栏目反映,他在阿里健康平台上预约洗牙服务时,却被告知要输入身份证号码,这令他无法接受。

环球滚动:找定位 找方向 找基点 五粮液奋力打造中国式现代化酒业样本

面对全面建设社会主义现代化国家新征程,白酒行业如何乘势而上,顺势而为,走好高质量可持续发展之路,正成为白酒企业关注的重点

速读:净月潭有什么好玩的地方?16个重点景点推荐

长春净月潭有什么好玩的地方?重点景点推荐游览路线推荐(西向东):女神广场-水库大坝-小森林浴场-西门-大森林浴场-滑雪场索滑道-瓦萨博物馆-高

“美式环保”太双标!(观象台)

近日,美国环境保护局发布的一份环保报告称,从2020年到2021年,美国对空气、水和土壤的有毒化学物质排放量增加了8%。

当前看点!广东持续推动“能效电厂”节能减排项目高质量进阶

为此,按照广东省能源局有关推动能源绿色低碳转型发展的工作部署,广东省节能中心(广东省亚行贷款能效电厂项目执行中心)经过一系列前期评估

全球观察:上海水务局史家明_上海水务局

1、上海市水务局,为市政府组成部门,上海市海洋局与上海市水务局合署办公。2、机关内设机构有:(一)办公室(二)政策法规处(三)综合规划处

春季公路养护忙灌缝“疗伤”正当时

本报讯近日,伴随气温回升,市城管局七里河建管中心全力做好百泉大道、滨河观光路等辖区道路管护工作,抢抓路面裂缝处置黄金时机,为群众提供

无痛回奶手法教学_无痛回奶的手法图解

1、第一:首先,如果乳房疼痛,可以挤出少量乳汁。切记不要挤出来,否则会促进乳汁分泌,适得其反。2、第二:注意减少对乳头和

南财基金通·股票型基金收益排行榜(4月10日) 快看点

根据南财基金通数据:2023年4月10日当日收益较高的股票型基金包括:鹏华医药科技股票型证券投资基金(001230,日收益2 56%);长盛医疗行业量

每日热文:《家庭托育点管理办法》公开征求意见 公众盼家庭托育点不负所“托”

【记者调查】家中两岁小娃谁来带?这让北京家长林夕的家庭“硝烟四起”。双方父母身体不好,无法长期带娃;请过几个育儿嫂,却总是不能满意...

中国船舶工业行业协会标准化专家委员会正式成立|天天时讯

上证报中国证券网讯据中国船舶工业行业协会消息,日前,经中国船舶工业行业协会批准,中国船舶工业行业协会标准化专家委员会正式成立。成立标

每日视点!广西柳州30万株洋紫荆盛放 城市成“大花园”

蒋雪林摄柳州的桥与盛开的紫荆花交相辉映

华盛锂电(688353)4月10日主力资金净买入302.91万元 焦点简讯

截至2023年4月10日收盘,华盛锂电(688353)报收于67 25元,上涨2 16%,换手率3 01%,成交量8067 0手,成交额5392 46万元。

再次出发!三星延长与AMD的GPU授权协议|世界消息

4月6日消息,三星电子于今日宣布将延长与AMD之间的战略知识产权授权协议,这意味着三星电子能够继续使用AMDRadeon图形解决方案。

今日聚焦!喜报!经开区中汽中心工程院获批天津市专精特新中小企业

日前,天津市工业和信息化局发布了对2023年度第一批天津市专精特新中小企业拟认定名单(第一部分)的公示,中汽研(天津)汽车工程研究院有限

拜登称计划参加2024年美国总统大选 全球今热点

据美国《国会山报》、美国全国广播公司(NBC)报道,美国总统拜登当地时间周一(10日)表示,他计划参加2024年美国大选,但尚未准备就此发表正

3月理财产品发行量环比上升

南方财经4月10日电,记者从普益标准获悉,2023年3月全市场共新发了2855款理财产品,环比增加491款,其中296款为开放式产品,其平均业绩比较基

猜您喜欢

Copyright ©  2015-2022 青年服装网版权所有  备案号:皖ICP备2022009963号-20   联系邮箱:39 60 291 42@qq.com