3 月 29 日,量子位创始人兼 CEO 孟鸿在首届中国 AIGC 产业峰会上正式发布了《中国 AIGC 产业全景报告暨 AIGC 50》。该报告由量子位智库出品,基于长期的行业跟踪与广泛的市场调研,提名了目前国内最值得关注的 50 家 AIGC 机构,无界 AI 入选其中。孟鸿表示,在生成式绘画方面,无界 AI 是国内“先行者”,目前全网覆盖用户超过 200 万人,让“人人都是艺术家”成为可能。
本次峰会由量子位举办,以“Hello New World”为主题,从产学研等多维度,覆盖大公司玩家、创新创业公司、学研和创投代表,全方位探讨和分享中国AIGC产业的现状、机遇和未来。无界AI 联合创始人马千里应邀出席峰会圆桌论坛,就“中国AIGC新机遇“这个当前最受关注的议题,同其他公司代表展开激烈的讨论。
除了马千里,参与《中国AIGC新机遇》圆桌对话环节的还有量子位主编金磊、元语智能联合创始人兼COO朱雷、峰瑞资本投资合伙人陈石和华院数智人商业化副总裁林莱尼。
以下对话内容由巴比特整理——
金磊:
我们每个话题都设置了一个关键词,第一个关键词叫“感受”,在这波AIGC热潮中,您最直观的感受是什么?
朱雷:
震撼和冲击。比如,ChatGPT在各行各业接受程度和应用深度,远远超过了我们的预期。原来对AI的关注群体都在小圈子里,AI也仅仅是在某些环节里应用,这次它破圈了,这是一个非常大的技术变革。
陈石:
经历了几次AI的技术变革,但这次还是让我们感到惊讶,突然一个跳跃,不是连续的变化。它已经具备了通用人工智能的火花,而且还在不停燃烧,所以也很惊喜。
从产业角度来说,它一定对整个人类社会的效率、体验,都会是一个非常大的提升,很本质地改变各行各业,特别是内容行业、教育行业、科研等等。
所以,我们很兴奋,这是人类的福祉,前提是你不要背叛人类。另外,我觉得也是创业者很好的机会。
马千里:
站在创业者的角度看会更加焦虑,因为发展速度太快了。你做了大量工作,但是有可能在大模型底部的创新,或者是别的团队的创新,他们很快就能赶上来,有时候会有技术的焦虑感。
另一方面,其实是所有行业内的人都在焦虑,甚至传统产业的一些人也在焦虑,因为他们焦虑他们会找到我们,抱团取暖。比如奇瑞汽车、上汽集团,有做潮玩的,做快消品的等等,他们都会找到我们,他们会把他们的设计需求,把他们的一些诉求提给我们,我们一起去做AI的训练,甚至他们给我们大量的私有化数据,就像某一家做房产的,他们有大量的建筑设计的那些比较隐私的图片,他们会把这些图片给到我们,我们一块去做训练。他们担心的是说如果他们不参与到这个浪潮里就会被淘汰掉。
所以,虽然有焦虑,但更多是在焦虑中有前进的感觉。
金磊:
我们的第二个关键词叫做模型同质化和创新性。就目前来看,无论是AIGC应用的玩法,或者是背后算法模型似乎有同质化的趋势。您觉得中国AIGC的原创性该如何体现?
朱雷:
目前来讲,在基础研究或者原创性上国内与国外是有一段距离。但是不是说我们目前做自研的大模型没有价值,我觉得反而势在必行。
第一,我们国内都在做中文语料的大规模梳理,中文数据集、中文的通用语料质量相对来说会差一些,开源氛围也差一些,比如医疗这个行业,国外有很多开源数据集,国内我们了解到只有两个,一个是杭州这边有家医院,一个是自贡市有数据集。我们要做这个事情,就要推动开源数据集以及开源模型的一个氛围和一个生态构建。
第二,现在大模型的AI基础设施在国内已经达到了相当高的重要程度的量级,这个时候对人才的吸引力很高,从长期角度来看,这个事情的意义对于国内做基础设施的,长远上来讲是非常有价值的。
说到国内的这些模型的同质化和创新性,对于国内初创公司来讲,创新性是要体现在你要对于这个行业有足够多的理解,以及迅速地在行业内把数据和场景跑起来。对初创公司来说,你可以在模型底层数据层面上和指令微调层面上做一定的创新性。
马千里:
做产品创新,拥抱SD(国外开源文生图模型stable diffusion)生态只是第一步,因为大量数据训练其实还是要自己去做。你如果想做出差异化,这是自然一种选择。
现在开发国风模型(国风风格的文生图),我们会有大量国风类图片数据,比如像中国人的脸、外貌、汉服,需要很具体、很精细区分不同时代、名族服饰样式,你的左衣襟和右衣襟之间都会是有区别的,做国风类图片的这些人他很要求这些东西。
这是一方面,最重要创新在于,中国的用户数据是非常重要的。我们无界AI平台有200万用户,每天创作接近3000万张图片。这些内容被大量用户的收藏,使用一键同款制作等等,这么多用户的行为给你反馈。我们会把这些受到喜欢的作品的关键词,拿来做进一步模型训练,使得我们平台能力得到增强,得到创新,这也使得虽然基于开源SD,但是我们平台的作品质量会和市面上大部分产品不太一样,因为我们有自己的数据循环在里面,这是一个创新点。
金磊:
我们看到好的模型出来,或者科技热点出来,国内会一窝蜂拥上去,这会不会产生一些泡沫,您怎么看待这个问题?
陈石:
这次不仅仅是国内,海外也是一窝蜂。有个统计是2022年平均四天出一个大模型,大概90多个大模型,主要是以美国为主。
热度当然很高,但我不认为这是一个短期的热潮,我不认为他是泡沫,我觉得它会经历很长时间的进步,会产出很大的社会价值和商业价值。
金磊:
针对大模型还有一个问题要讨论一下,就是参数规模,这个关键词叫做大力一定会出奇迹吗?大力出奇迹这种方式一定是AIGC未来必经之路吗?
马千里:
如果能出奇迹不管大力还是什么力都是好事情,在国内大家觉得大力出奇迹是一件坏事情,其实不见得是坏事情。
另一方面,有一个观点说,人类希望干预机器,教机器怎么下围棋,让他学习人类的棋谱。其实最有效的方法是自我学习,无监督的学习,一定程度上我们人类太多干预反而限制了它的发挥。本质上可能还需要大量算力,算法上也会跟进,不是那么强地去干预它。
金磊:
咱们训练一次大模型,参数特别大的话,动辄数千万美元成本,投资角度来看您如何看待大力出奇迹事情,创业公司有机会吗?
陈石:
大力出奇迹是必然,就是这个阶段,因为这次是无监督学习的一个突破,因为无监督学习特别是大规模无监督学习一直是机器学习的圣杯,从来没有人取得过这个圣杯,但是我觉得OpenAI把这个圣杯拿下来了,本身就是要靠大量的数据无监督的去学习产生的,我觉得是一个趋势,是当下被验证的一个事情,所以估计大家还会这么做。
商业角度来说,我觉得大的模型还只能这么训练,但是作为创业者去专注于做应用层创业,其实可以不需要自己去训练模型,最多可以说在一些大模型基础之上做一些调优。我觉得大部分创业机会可能还是在非模型层,或者说是在一些垂类的模型。
大模型,我觉得未来中国可能也不会有太多家,全球也不会有太多家,有一些模型可能是垂类模型,这个是很大的机会。
金磊:
我们最后一个关键词,“中国AIGC新机遇”。我们想请在座各位用简短一句话来谈谈您对它的一个期待。
林莱尼:
我们会发现互联网企业可能对于35岁+的这些人群不是非常友好,我们也会思考,AI真的是创造了失业潮吗?后来我觉得也并不是,我很喜欢一句广告词,“永不放弃,奔向未来”,面向未来一定要勇敢。
马千里:
对于中国的机遇来说,可能未来的大模型,即使你和国外有差距,甚至有几倍的差距,但是可能对于人类来说都够用了。
苏联和美国冷战的时候,都说自己能毁灭地球多少遍,其实毁灭一遍就够了。AIGC产生的能力可能会强到,即使两个模型之间有百分之多少的差距,但都无所谓,对于人类来说够用了,这是一个长期的看法。
另外,即使现在我们在大模型上,的的确确可能没有外国人那么强,但是从逻辑上我们应该还是能赶上的。
陈石:
我觉得其实这是全人类的机遇。
另外,我觉得中国是有机会做成一个自己的大模型的,因为算法是人类共同科研的成果,它整个的训练过程起码在GPT3我们都看的到,包括ChatGPT人类反馈的强化学习,也都看到了这个过程,可能有一些语焉不详。所以做一个大模型剩下的是一些工程的工作,在工程工作上我们中国的工程师是不怕的。
从算力维度讲,这个事情还是需要慢慢来,我觉得可能尽量去想一些替代的办法,就是有自己的算力,或者以别的方式获取一些算力。
数据呢,我觉得我们是可以做到的,因为数据集这个事情,相对我们还是有办法的。
凭着中国人的聪明程度,我觉得基础模型是可以突破的,当然复现到今天GPT4这个能力,可能还有差距,但是是时间问题。
在应用层面,微信、钉钉等,历史已一再证明,中国在软件的应用上是很厉害的。
朱雷:
我非常同意陈石总的看法,虽然说现在跟GPT4比技术差距还是有的,但确实是时间的问题。但是是机遇的同时也是一种挑战。我最后一句话就是我们要拥抱AI。