您的位置: 首页> 骑闻 > 正文

字节的野心:做大模型时代的「军火商」

2023-06-30 02:43:57 来源:Bianews鞭牛士

字节跳动谨慎迈出了跨入大模型赛道的第一步。

6 月 28 日下午,字节旗下的火山引擎召开发布会,首次正式公布在大模型领域的研发布局和合作进展,并发布大模型服务平台火山方舟,提供模型训练、推理、评测、精调等全方位功能与服务。

此前,百度、阿里、腾讯、商汤、360 等国内大厂已经相继宣布入局,大部分的做法都是发布一个通用大模型或者数个行业大模型底座,行业客户可以基于这些基础模型和自身拥有的行业数据精调,打造一个服务自身业务的 AI 应用。


(资料图片仅供参考)

但字节的切入方式与其他大厂有明显的不同。火山没有发布自己的通用大模型或者行业大模型,火山方舟聚合了一批第三方生产商开发的大模型底座。

火山引擎向大模型生产商提供构建、训练大模型基座所必须的算力和工具体系,并将这些生产商的大模型聚集到自己的 MaaS 平台,供应给企业使用。这与微软投资算力供给 OpenAI,并基于后者开发的 GPT 模型向企业提供 Azure AI 云服务,有相似之处。

因此,火山引擎介绍的合作案例也与其他大厂有所差异。这场发布会上登台的合作伙伴,包括英伟达这样的上游显卡供应商,以及智谱 AI、百川智能、IDEA 等当下国内第一梯队的大模型开发商。而其他大厂的发布会,介绍的往往主要是金融、文旅、企服等各行各业的合作伙伴。

火山引擎总裁 谭待

截至今年 5 月,国内已公开披露的大模型数量达到 79 个。按照火山引擎总裁谭待的说法,未来大模型市场一定不会是一家或者几个寡头垄断,而是一个百花齐放的多模型市场,会有少数几个超级大模型,多个通用大模型,和更多行业/垂直大模型。

企业使用大模型,未来也会呈现「1+N」的模式,除了通过自研或深度合作,形成 1 个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有 N 个模型同时应用。

大模型开启了新一轮行业变革,在这个淘金时代,OpenAI、谷歌、MiniMax、百川智能等大模型生产商是时代浪尖的淘金者。而火山引擎要做的,就是要在大模型时代「卖铲子」。

01

火山引擎大模型

服务平台——火山方舟

会上,火山引擎发布了自己的 MaaS 平台——火山方舟。

火山引擎总裁谭待在会后接受媒体采访时强调:火山方舟最终服务的是模型的应用方;火山引擎是跟大模型的生产方合作,一部分被精选的大模型厂商在火山方舟上部署,然后对外提供服务。

想让企业用户和大模型生产商加入到火山方舟的生态体系,首先要解决的是数据安全的问题。

火山引擎总裁谭待认为,企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。「火山方舟」的首要任务,就是做好大模型使用者、提供者和云平台可以互相信任的安全保障。

据火山引擎智能算法负责人吴迪介绍,「火山方舟」已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。

安全沙箱示意图

此外,「火山方舟」还在探索基于 NVIDIA 新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。

第二,想要让企业可以更高效地打造 AI 大模型应用。一方面要降低企业用户使用大模型打造应用的门槛,另一方面也要降低用户使用大模型服务的成本。

上文提到,火山引擎认为未来企业使用大模型会呈现「1+N」的模式,也就是 1 个自研主力模型+N 个小模型同时应用。比如一个对话式的 AI 服务产品,对话功能的基础是源自企业自研的大模型,但提供文生图、文生视频、特定语种翻译,或者回答医疗、金融等专业领域的问题时,却可以调用其他的小模型。

这样做最大的好处是降低模型的推理成本。吴迪称,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素,「一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。」

举例来说,微软以医学文章数据精调了生物领域的 BioGPT-Large 模型,仅有 15 亿参数,其在 PubMedQA 基准测试中的准确率却优于有着上千亿乃至数千亿参数的大型通用语言模型。

但对企业来说,「1+N」模式的一大痛点就在于开发应用的过程中,需要调用各种不同的大模型。而火山方舟提供的第一个功能就是模型广场,不仅集成了大量的第三方大模型,企业自身开发的大模型也可以通过这个平台进行管理。

吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。这些自定义指标和评估数据的积累,将成为企业在大模型时代宝贵的数据资产。

火山方舟负责人 吴迪

02

火山引擎的

大模型「朋友圈」

火山引擎畅想的前景非常理想,但要做到有一个前提,就是大大小小的大模型开发商需要聚集到火山引擎。数据安全是他们愿意接入火山引擎的必要条件,但显然不会是充分条件。火山引擎吸引大模型开发商合作的基础,在于其掌握的算力资源,也就是过去囤积的大量 GPU。

去年 ChatGPT 发布后,国内 AI 算力紧张已经算是行业半公开的秘密,而字节跳动拥有国内最丰富的算力资源。

据《晚点 LatePost》报道,字节今年向英伟达订购了超过 10 亿美元的 GPU(约合 70 亿元人民币),到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年全年,英伟达数据中心 GPU 在中国的销售总额大约为 100 亿元,也就是说,仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。

大部分团队没有条件购买大量 GPU 训练大模型,从火山引擎采购算力也就不足为奇。而对火山引擎来说,大模型生产商发展越好,业务量越大,反过来就需要购买更多的算力。所以在这方面,大模型生产商和火山引擎有着相同的诉求。

今年 4 月,火山引擎宣布与国内 70% 的大模型生产商达成合作,原因也在于此。

「火山方舟」首批大模型合作伙伴

会上,火山引擎重点介绍了第一批加入火山方舟的大模型,包括百川智能、出门问问、复旦大学 MOSS、IDEA 研究院、澜舟科技、MiniMax、智谱等多家 AI 科技公司及科研院所的大模型,并已启动邀测。

而首批邀测的企业,则包括金融、汽车、消费等众多行业的客户。北京银行 CIO 龚伟华表示,大模型与客户营销、办公协同、数据智能的结合,在金融应用场景有巨大潜力。北京银行将与「火山方舟」合作,在算力优化、模型精调等方面展开研究,共同推动金融风控、营销等模型应用落地。

除了第三方的客户,吴迪介绍,在火山方舟平台推向市场之前,已经利用众多的内部产品打磨和改进平台。字节跳动有 10 余个业务线正在探索接入和试用,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。

但是,对于这些内部尝试何时面向用户,吴迪向极客公园表示:还需要一些时间,把大模型应用好是一个需要长周期打磨的事。

火山引擎总裁谭待进一步补充:有一些应用对用户是无感知的,因为它是在已有的环境中去提升效率,而不是像 ChatGPT 这种大模型原生应用,用户能明显感知到是一个大模型来做这个事情。比如客服这个场景,回答时需要检索知识库,但现在通过大模型去给它一些提示,但跟你对话的还是那个对应的客服,只是它的效率高了。

03

字节跳动的下一步

目前来看,字节/火山布局大模型第一阶段的思路已经非常清晰。

从商业上看,火山引擎就是卖水卖铲子的思路。凭借火山引擎的技术体系,加上此前算力资源的积累,做管道和前期的底层服务应该是没有任何问题,所以在这个阶段把基础工具开放出来,帮助大家做好大模型,或者更直接说,从收益上的考量,这个阶段发布技术体系工具比发布大模型的收益值更高。

但有一个很重要的问题是:今天卖铲子的字节,未来会不会下场淘金?

答案是肯定的。谭待告诉极客公园,其内部也有团队在研发大模型。如果做好了,也会上到方舟平台对外提供。此前字节副总裁杨震原也曾向财新回应:字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。

但这存在一个问题,就是如何平衡自家大模型和其他第三方的关系。对此,谭待表示,自家的模型只会是众多模型中的一个,其余的是客户自己的选择,不需要火山来平衡,一个企业未来一定会在多个场景用多个模型,因为每个模型在不同场景的性价比是不一样的,这会是一个开放的市场。

正式入局后,不少行业人士看好火山引擎在大模型领域的市场份额会在接下来一段时间快速飙升,原因主要有三个:

第一是因为基础需求。字节本身在云服务这个层面是国内用量排在前三的公司,就算火山引擎,最终只是为了服务字节这一个生意而建,它的收益和投入产出比都是相当可观的。

第二是产品能力。字节这套体系迭代出来的产品工具向外传递,在云服务里的积累和产品化的能力会非常的强,从这个维度来说,对于很多中小开发者,甚至有体系的开发者是很有吸引力的。

第三是因为生态系统成熟。字节本身在云服务这套体系并不是只做了火山引擎,字节在上下游的广告分发、基础设施建设,开发工具等维度都有完善和成熟的生态链,甚至早几年还收购了开发者社区。有着可靠的基础体系,完整的工作链条和生态社区。

过去字节布局国内云服务市场的痛点,在于起步较晚,飞书要挑战已经成熟的钉钉、企业微信,而云服务的特点就是前期获客难,但获客后由于用户迁移成本太高,所以轻易不会更换。

今天的大模型是一条全新的赛道,所有云服务厂商又回到了同一起跑线,对于想要打开云服务市场的字节和火山而言,这也是十年难得一遇的机遇。

关键词:

资讯
业界
企业
骑闻
产品
“蒸笼”模式继续!上海今天最高温可达36 午后雷雨概率增大
今日申城多云开场,阳光依然不错,午后热度不减,全天气温28~36,吹的
2023-06-29
含位置图丨2023年天津第二批集中供地预申请信息|热推荐
含位置图丨2023年天津第二批集中供地预申请信息,天津市,大运河,土地出
2023-06-28
焦点信息:力成科技再售半导体封装资产:拟1.316亿美元向江波龙出售苏州力成70%股权
在半导体封装测试领域颇有声名的力成科技接连出售旗下封装资产。  据
2023-06-28
加拿大多伦多市选出首位华裔女市长
加拿大多伦多市选出首位华裔女市长
2023-06-28
行政复议法修订草案二审稿:充分保障申请人合法权益
行政复议法修订草案26日提请全国人大常委会会议二次审议。草案二审稿还
2023-06-28
天天快讯:欧比特(300053.SZ):证券简称“航宇微”于6月28日启用
格隆汇6月27日丨欧比特(300053)(300053 SZ)公布,公司名称由“珠海欧比
2023-06-28
OnePlus手机将允许您在不受支持的应用程序中强制使用暗模式 世界新视野
小编发现不少朋友对于OnePlus手机将允许您在不受支持的应用程序中强制
2023-06-29
JS环球生活(01691):SharkNinja向美国证交会提交上市有关的注册声明_看热讯
JS环球生活(01691)发布公告,于2023年6月28日,SharkNinja向
2023-06-29
世联赛韩国水原站:中国女排1比3不敌塞尔维亚女排_世界热点
据人民日报客户端消息,6月28日,2023年世界女排联赛韩国水原站进行第
2023-06-29
河南省开封市有哪几个县城_河南开封有几个县分别是那几个
1、河南开封有县,即尉氏县、兰考县、淇县、通许县。2、尉氏县东与通许
2023-06-29
每日消息!男子在动车上霸座充电,涉嫌扰乱公共交通工具秩序被行拘7日
尹女士从惠州南站上车后发现自己的座位被占,便向陈某提出了让座的要求
2023-06-29
太阳能:公司于2022年收到第一批核查目录项目可再生能源发电补贴款 世界滚动
同花顺金融研究中心6月28日讯,有投资者向太阳能提问,有传闻财政部正
2023-06-28
看完催人泪下的经典电影推荐 十大让热血沸腾的电影|环球即时
hello大家好,我是大学网网小航来为大家解答以上问题,看完催人泪下的
2023-06-29
焦点资讯:大力发展冻干食品产业 福建华安在京举办专场品鉴洽谈会
大力发展冻干食品产业福建华安在京举办专场品鉴洽谈会---6月27日下午,
2023-06-29
爱你爱到骨子里的情话_情话伤感句子 爱你深入骨髓如何忘记 天天快播
我去得了任何地方,却永远到不了你心里,就像你一直在我心里,却永远看
2023-06-29
焦点速读:曝Xbox为增加云游戏的投资 牺牲了XSX|S主机的产量
FTC听证会披露的文件显示,自XSX|S推出以来,微软一直在牺牲其销量增长
2023-06-28
南昌老庙黄金多少钱一克(2023年6月26日)
金投黄金网6月26日讯,南昌黄金价格_南昌老庙黄金多少钱一克 
2023-06-27
世界热文:大宗交易:汇嘉时代成交2522.78万元,折价10.76%(06-27)
2023年6月27日,汇嘉时代发生了1笔大宗交易,总成交万股,成交金额万元
2023-06-27
字节的野心:做大模型时代的「军火商」
字节跳动谨慎迈出了跨入大模型赛道的第一步。6 月 28 日下午,字
2023-06-30
每日资讯:第五期昌平文化旅游沙龙举办
第五期昌平文化旅游沙龙举办
2023-06-29
【焦点热闻】新疆艺术学院:天山之歌唱响濠江
中国教育报-中国教育新闻网讯(记者蒋夫尔)日前,由新疆艺术学院艺术
2023-06-29
环球速讯:2399元的RTX 4060 值得买么?
月底,RTX4060显卡就将正式开售,这也是40系显卡中首款在2000元左右的
2023-06-28
商船三井与雪佛龙建立战略联盟合作推动航运业脱碳
6月23日,日本商船三井宣布与雪佛龙新加坡公司(ChevronSingapore)签
2023-06-28
当前热点-铜库存
6月27日LME铜库存减3050吨至77050吨。6月27日LME铝库存减1350吨至536425吨
2023-06-28
【世界播资讯】浙商银行太原分行积极开展防范非法集资宣传月活动
根据监管要求,结合浙商银行总行6月金融知识教育宣传活动的统一布置,
2023-06-28
兰石重装:拟合资筹建氢能及氨氢融合新能源技术产业发展平台公司|全球报道
  上证报中国证券网讯(记者孔子元)兰石重装公告,公司与仙湖科技、
2023-06-28
宛延(关于宛延介绍)
大家好,小万来为大家解答以上的问题。宛延,关于宛延介绍这个很多人还
2023-06-28
东鹏控股:618大促连续三年领跑瓷砖行业
中证网讯(记者万宇)东鹏控股近日发布消息,截至6月20日,东鹏瓷砖斩获
2023-06-27
环球实时:[路演]恒工精密:近三年营收年复合增长率为27.89% 业务规模呈增长趋势
6月26日下午,河北恒工精密装备股份有限公司(以下简称“恒工精密”,
2023-06-27
立讯精密:6月26日融资买入2.19亿元,融资融券余额27.82亿元-每日热门
6月26日,立讯精密(002475)融资买入2 19亿元,融资偿还1 36亿元,融
2023-06-27
06-29 山东泰山球员徐新预测了国足与马尔代夫的比赛_全球微资讯
山东泰山球员徐新预测了国足与马尔代夫的比赛_全球微资讯
6月11日晚上,在微博节目连线中,山东泰山球员徐新预测了国足与马尔代 [详细]
06-28 【报资讯】文一科技6月28日盘中涨停
【报资讯】文一科技6月28日盘中涨停
以下是文一科技在北京时间6月28日11:08分盘口异动快照:6月28日11点8分 [详细]
06-28 今鼎股份拟引入新投资者对控股子公司增资约 778 万元 增强公司综合实力
今鼎股份拟引入新投资者对控股子公司增资约 778 万元 增强公司综合实力
6月27日,上海今鼎矿产品股份有限公司发布公告称,公司之控股子公司江 [详细]
06-28 湖北省武汉市楚信公证处工资待遇
湖北省武汉市楚信公证处工资待遇
2023武汉市楚信公证处招聘公证员助理待遇如下:供大家参考薪酬基本工资 [详细]
06-28 六福集团公布2023财年年度权益分配方案
六福集团公布2023财年年度权益分配方案
同花顺财经讯六福集团(00590 HK)6月27日发布公告,公司将于2023年9月 [详细]
06-27 天天实时:存储价格断崖式猛跌 2TB PCIE 4.0固态硬盘只要400元 速度达7100MB/s
天天实时:存储价格断崖式猛跌 2TB PCIE 4.0固态硬盘只要400元 速度达7100MB/s
近几年硬盘价格可以说就像坐着滑梯一般极速探底,这种趋势最高兴的自然 [详细]
06-27 完善住院陪护制度须坚持患者利益优先|看点
完善住院陪护制度须坚持患者利益优先|看点
秋实  近日,云南一位王女士向记者反映,今年4月中旬,她家人患有神 [详细]