幻想最多的可能不是大模型,而是 AIGC 本身
文 / 王子威 @零售威观察
AIGC,或者叫做 “生成式 AI(Generative AI)”,是当下极其热门的投资领域。近期,在交流过海量项目,并对部分早期项目进行投资后,我认为有必要进行一些反思,对过去几个月的心路历程进行复盘。
本文内容仅为个人总结、个人观点,其中必然充满偏见和错误,希望可以抛砖引玉。请勿作为投资指导,DYOR。
【壹】模型#
AIGC 的第一个投资维度是模型。
生成式 AI 的爆发是伴随着 ChatGPT 在 2022 年 11 月的横空出世,此后,大量的大语言模型(LLM)也逐步走入市场。毫无疑问,从逻辑上看,模型是一个投资视角。
然而,问题很明显,投入过于巨大:模型的单次训练成本极高,人才要求极高,所以国内基本都是大厂 —— 例如百度、阿里、科大讯飞等机构在做,虽然有一些非大厂已经提供了优秀的大模型,但是他们的估值大多数也已经达到数十亿元,这已经不是普通 VC 能接受的了。
换句话说,在国内,模型方面的投资窗口,从目前看,基本已经关闭了。
【贰】数据#
AIGC 的第二个投资维度是数据。
数据既要关注质又要关注量,比如 Chat GPT 的数据源就包括维基百科、特定书籍与期刊、Reddit 精选内容(WebText)和特定的网络爬取内容(Common Crawl,这是 2008 年至今的一个网站抓取的大型数据集,数据包含原始网页、元数据和文本提取,它的文本来自不同语言、不同领域。),这就是典型的有质有量,叠加优秀的大模型,就可以发挥出很好的效果。
对于国内的生成式 AI 产业来说,有独特数据源的企业是值得关注的,也就是你有某个特定行业数据,这样,你的模型就是针对特定行业定制的,就是所谓的 “一米宽一百米深” 的逻辑,做垂直行业、细分行业的特定模型。
问题来了,你的数据从哪里来?
公开数据,嗯,这很好,但是要提一句,请注意数据的合规问题,不然就是 “爬虫用的好,牢饭吃到饱”;
私有数据、内部数据,他们从哪里来呢?这就要看团队的积累了,可以说是团队过去多年 “隐性资产” 的变现能力:
比如,一个 “AIGC + 设计” 的团队是来自于拥有海量图片、影音版权的平台,但是这个设计业务可能最终客户是在电商上销售产品的消费品品牌;
再比如,一个 “AIGC + 电商” 的团队是来自阿里、京东等顶尖电商巨头,服务的可能是企业的电商客服或者选品、测款等步骤,最终目标是打造类 SHEIN 的小单快反等等。
【叁】规模#
AIGC 的第三个投资维度是规模。
规模 —— 或者说是收入 —— 一直是投资人最关注的指标,虽然规模并不意味着护城河,但是至少证明你是个值得重视的玩家。
事实上,生成式 AI 领域目前真正形成规模的项目是相当稀缺的,大部分项目依然处于早期阶段,而这些早期项目又开始陷入两个陷阱当中。
第一是项目制,做一单赚一单的钱,对于早期团队去做标杆案例、了解客户需求是有价值的,而且也会产生养活团队的现金流(我们暂时不考虑应收账款的问题)。这里的陷阱是,你如何证明你未来不是项目制,甚至从 VC 角度,当我们脑海里闪现出 “项目制” 三个字后,就是一件很麻烦的事情了。
更麻烦的是第二个陷阱,很多创业者说自己不是项目制,未来会走向订阅 + 按需付费,但是这种订阅本质上绝大多数是 SaaS,无论你是如何用 AI 去赋能这个 SaaS,你本质还是 SaaS。
SaaS 的问题有两点:
第一,国内针对小微企业的 SaaS 其实是相对伪命题,这点和美国市场有本质区别。而且,如果你真的是做 SaaS 的话,也请关注你的各类核心指标,例如 CAC、LTV、ARPU、NDR 等等,用这些指标来实时监控自己的发展。
第二,你的 SaaS 如果只是降本增效,那么十分抱歉,你基本收不到钱;只有增收 —— 对,绝对不能仅仅是 “增效”—— 才有可能从增量中抽佣,并且长期抽佣。
事实上,当你能做到增收的时候,你可能并不仅仅是个 SaaS,而是切入业务、供应链的 BaaS—— 这其实反过来对你的团队又有了新的要求。
最后总结一下,在 AIGC 领域的投资方面,模型看的是技术,目前投资窗口几乎已经关闭;数据看的是团队在过去的积累,有机会;而规模看的就是模式,一定要避免走偏。
“
《零售威观察》以全球视角,关注于新零售、新消费领域最新战略、战术与思考,对超级会员体系、国内外新零售案例有深入研究。平台创始人王子威,独立零售分析师