最近大模型的涌现,比大模型能力的「涌现」都要快
编者按:本文来自微信公众号真探AlphaSeeker(ID:deep_insights),作者吴鸿键,创业邦经授权转载。
“最近大模型的涌现,比大模型能力的「涌现」都要快。”
(资料图片仅供参考)
「涌现」是一个专业概念,放在大模型的语境里,指的是模型在突破某个规模时,出现了意想不到的能力。这话虽然是调侃,但也高度概括了行业现状。
ChatGPT在全球掀起热潮以来,国内已有多家公司发布或将发布自己的大模型,这些公司中既有阿里巴巴、百度、京东、华为等互联网或科技大厂,也有以商汤为代表的AI公司,以及备受瞩目的初创企业(例如王慧文的光年之外,王小川的百川智能)。
如果再把科研院所算上,据民生证券的统计,国内目前已有超30个大模型亮相。行业俨然有大模型“军备竞赛”的意思。
“混战”本身说明了不少事情,比如各家都已认识到大模型的价值,试图通过大模型升级已有业务和打开新增长空间。即使人们普遍认为大模型门槛高,但“百花齐放”也折射出业界认为大模型的发展尚处早期,且并不是只有极少数大玩家才能参与的游戏。
机会看上去很多,但拨开冗杂的信息,我们需要判断,大模型的“涌现”是不是昙花一现?以下四点值得关注。
产业融合成共识相比ChatGPT在用户端的热潮,国内厂商更愿意谈大模型和产业的结合。“客户”是高频词,“接入我们的大模型”是共同目标。
以阿里巴巴的通义大模型为例,近期,阿里云官宣自研大模型“通义千问”并面向企业开始邀请测试,在阿里云峰会上,包括张勇在内的阿里云高管频频强调大模型能为各行业企业带来的价值。据阿里云智能CTO周靖人介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。
早些时候发布“文心一言”的百度,也是将B端“生态圈”作为宣传和业务重点。华为云盘古大模型提出了“AI for Industries”理念。推出大模型“日日新”体系的商汤,更是只面向政企客户开放API。
大环境对于生成式人工智能服务相对谨慎的态度、企业各自的资源和能力禀赋、以及在C端体验上和ChatGPT的差距,都可能是造成差异的原因。上述案例的共性是,大模型对于各家企业并非一个“另起炉灶”式的新业务,而是对已有业务方向的延伸和突破,对大模型的理解依然要放在公司已有的业务发展框架里来看。
依然以阿里云为例,云计算公司容易陷入“低毛利集成商”困境,难以在标准化和定制化之间找到平衡。预训练大模型带来了新的可能——在阿里云方面的设想中,企业只需将数据放在专属数据空间,用于大模型自动学习,然后就能生成企业专属的大模型。相比原本“什么都要从头做”的业务模式,大模型提供了效率更高的选择。
扬长避短,各秀肌肉目前,国内的大模型厂商并不讳言和OpenAI、ChatGPT的差距,只是各家对于“差距有多大”有一些不同的判断。
相比OpenAI,国内互联网大厂有成熟的业务矩阵,多元的能力架构,以及在多年实战中锻炼出来的差异化能力,因此大公司们愿意强调的能力和方向也有所不同。
例如张勇在云峰会上表示,阿里巴巴所有产品未来都将接入“通义千问”大模型。此举意在利用大模型升级甚至改造现有业务体系,阿里云方面将这种融合视为未来发展的关键,称“阿里巴巴和所有企业都在同一起跑线上”。
除了拿自家业务当试炼场,阿里云还在峰会上提及其他优势,比如指出大模型的研发不是简单的“堆叠算力”问题,强调阿里云在低碳低能耗方面的能力积累。这也是阿里云提出为企业打造专属大模型的重要原因。
百度的优势来自其在中文搜索引擎的领导地位,因此公司在发布文心一言时,着重强调了其“更懂中文”的特性。商汤则更多强调其在参数和算力上的优势。“日日新”体系包含自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar),其中“商量”参数约1800亿。商汤方面还强调,SenseCore大装置已完成2.7万块GPU的部署,并实现了5.0 exaFLOPS的算力输出能力,最高可支持万亿参数超大模型的训练。
除了应用,在和大模型相关的芯片和框架方面,国内大公司也有现成的积累。百度有昆仑芯、深度学习框架飞桨,华为有昇腾310和910芯片,ModelArts平台。这些同样是大厂在发展大模型时着重利用的对象。
大模型不稀缺,高质量数据才稀缺大模型“混战”还反映了一个信息:至少从表面上看,大模型不再稀缺。
民生证券在研报中指出,因为有开源基础以及大公司自本身的算力储备和资金实力,“单纯发布一个大模型的门槛没有市场想象中的那么高”。
“有大模型”不难,难的是“有一个能持续迭代,性能不断提升的优质大模型”。一些观点也提到,决定大模型发展的关键要素是高质量数据,尤其是在大模型“百花齐放”的背景下,数据是“胜负手”。
数据、算法、算力是AI能力三要素。
高质量的数据是助力AI训练与调优的关键,在和数据相关的流程中,数据采集、数据标注和数据质检又是较为重要的三个环节。但相比大模型的热闹,目前国内的数据相关产业链还有不小的提升空间。据“自象限”的观察,目前数据质量在国内尚未受到足够重视,缺乏专门做数据质量的企业,这类企业更多是以大公司附庸品的形态出现。
而在海外,数据质量形成了垂直赛道,其中的公司会帮助AI企业最大限度地减少劣质数据带来的影响,这类公司产品通常包括数据可观察性平台、数据整理和偏见检测工具,以及数据标签错误的识别工具等等。
到底需不需要这么多大模型最后是一个灵魂之问:行业需不需要这么多大模型?或者说,在大厂相继发布大模型的背景下,新玩家还有没有加入混战的必要?
大佬们对此有不同的看法。早些时候李彦宏在接受采访时表示,现在国内大厂都看好AI大模型,创业公司重新做没有多大意义。相较而言,“基于大语言模型开发应用机会很大,没有必要再重新发明一遍轮子”。
并不是所有人都认同这一观点。根据“品玩”的采访,王小川认为“大模型就是需要时间长一点,认真一点,而钱也不是唯一重要的”,“有些公司虽然有大模型这个底子,但没碰好就练歪了,上战场更难受。”
由于大模型的门槛和不确定性,留给中小厂商以及创业公司的难题还有很多——规模跟不上大公司的节奏,中模型或小模型难以找到竞争点,也难以获得“涌现”机会。如果选择垂直场景切入,又有可能遭遇来自通用大模型的“碾压”,一如ChatGPT对Jasper.AI的冲击。
大部分关于这类问题的讨论,比如要不要做大模型,要做什么样的大模型,要选择什么样的场景来落地等等,目前都还处于“混沌”状态。不少人在表达观点时还会特意强调“就目前的情况看”,并表示自己未来可能会在观点上有摇摆。但行业普遍认为,大模型代表着大机会,最后只有少数玩家能留下。
本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。
标签:
最新推荐
创业者、河长、村支书,这是重庆市合川区三庙镇戴花村青年何波的不同头衔,但几个身份都指向了同一个使...
律师兼任调解员,不打官司也能化解纠纷,代理调解受指派的公益性案件还免费。这是兵团第十师北屯市探索...
根据教育部教育考试院统一安排,2022年上半年全国大学英语四、六级口语考试将于5月21日-22日举行,笔试...
学生代购的“苦”与“乐” “你问的这个产品现在做促销活动,买一件包邮,还送小样和面膜……”...
11月11日大连市新冠肺炎疫情防控总指挥部发布,11月10日0时至24时,大连市新增21例本土新冠肺炎确诊...
纤维素制成闪光材料无毒可降解 或彻底改变化妆品行业 科技日报北京11月11日电 (实习记者张...
海洋中或堆积了2 8万吨新冠废物 科技日报北京11月11日电 (记者刘霞)据美国趣味科学网站10日报...
开屏广告又现新花招,换个马甲就重来? ■ 来论 据媒体报道,“双十一”期间,一些App的开屏...
对不合理教师资格认定标准,该全面清理了 ■ 来论 针对网友留言反映的“糖尿病无法通过教师...
虚假宣传、以次充好、售卖临期产品不提示直播间商家“放水”让消费者闹心 关注“双11” 今年...
“扫码抽手机”实则是广告 快递单能“领红包”面单广告是谁发的? “双11”之际,消费者被商...
中新网11月12日电 据北京市疾病预防控制中心微信公众号消息,2021年11月10日北京市接报1例在京存在...
(抗击新冠肺炎)辽宁大连本轮疫情病毒为德尔塔变异株 24个区域划定为中风险地区 中新社大连11月1...
中新网西安11月11日电 (梅镱泷 杨起超)记者11日从西安市鄠邑区秦保局获悉,太平国有生态林场架设...
(抗击新冠肺炎)成都停业整顿56家零售药店 买感冒药需提供身份证 中新网成都11月11日电 (记者 ...
中新网大连11月11日电 (记者 杨毅) 11月11日,大连市政府秘书长衣庆焘在大连疫情防控新闻发布会...
新华社杭州11月11日电(记者冯源)在商周时期,如今的浙江中西部活跃着一个名为“姑蔑”的族群,但是...
中新网大连11月11日电 (记者 杨毅)11月11日,大连市政府秘书长衣庆焘在大连疫情防控工作新闻发布...
中新网大连11月11日电 (记者 杨毅)11月11日,大连市政府秘书长衣庆焘在大连疫情防控工作新闻发布...
中新网昆明11月11日电(记者 缪超)云南“最美政法干警”发布仪式11日在昆明举行。会上,授予昆明市...
(抗击新冠肺炎)甘肃凝聚“她力量”:互助抗疫,女人更懂女人心 中新网兰州11月11日电 (记者 徐...
中新网兰州11月11日电 (史静静)在甘肃金川公司,27年来葛小海始终在生产一线,他参与的“渣罐车制...
中新网乌鲁木齐11月11日电 (王小军 罗宣政 廖超)11月11日,一批来自浙江嘉兴的爱心物资,跨越...
中新网兰州11月11日电 (邬凡 朱学成)11月10日5时30分,位于敦煌车站旁的敦煌综合工区,钢轨探伤车...
中新网重庆11月11日电 (梁钦卿)“我今年上小学三年级了,我不怕疼,打疫苗是为了抵抗新冠病毒。”1...
中新网绵阳11月11日电 (岳波 李远梅)四川绵阳警方11日通报称,一男子酒后无聊多次报警称自己的...
中新网11月11日电 据中国民航局网站消息,11月11日,民航局再发熔断指令,对德国汉莎航空公司LH728...
中新网成都11月11日电 题:疫情中轮椅上的“逆行者”:想为大家做力所能及的事 作者 祝欢 ...
中新网上海11月11日电 (记者 李姝徵)上海警方11日召开发布会披露,在近期“砺剑”行动中破获了一...
中新网太原11月11日电 (记者 李庭耀)记者11日从山西省政府新闻办举行的新闻发布会上获悉,山西推...
中新网乌鲁木齐11月11日电 (刘雨珊 牛雨萌 艾尼)11日,记者从新疆水产科研所获悉,新疆博湖县将...
中新网大连11月11日电 (记者 杨毅)大连市新冠肺炎疫情防控总指挥部 11日发布公告,大连市将庄河...
中新网西安11月11日电 (记者 党田野)身穿白色“礼服”,摇晃着酒杯,时不时浅酌一口啤酒,然后与...
11月11日大连市新冠肺炎疫情防控总指挥部发布,按照国务院应对新冠肺炎疫情联防联控机制关于科学划...
中新网南京11月11日电 题:这个“双十一”南京的猪都“脱单”了 其实还有更让人嫉妒的…… ...
中新网呼伦贝尔11月11日电 (记者 张林虎)11日,记者从内蒙古自治区呼伦贝尔市公安局获悉,该局将...
中新网广州11月11日电 (记者 程景伟)“寻味帅府邂逅甜蜜——2021年帅府之夜”暨“海外拾珠——孙...
中新网徐州11月11日电 题:江苏徐州“家门口车管所”便民服务驶入“高速路” 作者 朱志庚 ...
中新网重庆11月11日电 (梁钦卿)为加强秋冬季空气污染应对,重庆市生态环境局11日发出2021年第九次...
新华社重庆11月11日电 题:深藏功名三十载 化作春蚕报乡亲——一名抗美援朝老兵的人生选择 新...
中新网益阳11月11日电 (王鹏 王庆庆)爱花本是修身养性、陶冶情操之事,湖南益阳市桃江县桃花江镇...
中新网成都11月11日电 题:成都25位民辅警的“封闭”生活:有人“转行”送外卖 有人变身“仓鼠管...
中新网南京11月11日电 (徐珊珊)江苏省教育厅体育卫生与艺术教育处处长张鲤鲤11日在南京表示,到202...
中新网成都11月11日电 (记者 吕杨)成都市公园城市建设管理局11日正式发布公园城市银杏观叶指数,...
中新网南京11月11日电 (徐珊珊)11日,江苏省教育厅召开新闻发布会,发布2020年江苏省学生体质健康...
中新网宜昌11月11日电 (江雅丽 董晓斌)17年前,四川广安一夫妇的6岁儿子被人拐走,夫妻俩寻找多年...
中新网宁德11月11日电 (林榕生)福建宁德市柘荣县应对新型冠状病毒感染肺炎疫情工作领导小组(指挥部...
11月11日,内蒙古额济纳旗新冠肺炎防控工作指挥部发布《关于调整额济纳旗达来呼布镇风险等级的公告...
(抗击新冠肺炎)内蒙古现有本土确诊病例32例 伊金霍洛旗确诊病例清零 中新网呼和浩特11月11日电...
中新网呼和浩特11月11日电 (记者 张林虎)11日,记者从内蒙古自治区通辽市相关部门获悉,从10日下...
成都抗疫的外籍志愿者:愿为城市“康复”贡献力量
Copyright © 2015-2022 东方律师网版权所有 备案号:沪ICP备2020036824号-8 联系邮箱:562 66 29@qq.com