上一篇文章为读者解读部分前台SaaS 能够通过提供额外AI插件应用提高价格,这篇文章将会为读者分析AI应用如何作用于后台SaaS应用的需求提升。
云计算行业经过2020/2021年疫情在家工作的推动后,2022年/2023上半年行业整体进入了调整期。云计算行业龙头AWS也从2021年每个季度按年增长超过30% 大幅放缓到最近季度按年约10%增长。随着人工智能应用(例如: 聊天机器人chatbot) 以及通用人工智能赋能更快的应用开发效率。例如,根据compass UOL study,使用通用人工智能(generative AI)能够提升软件工程师的效率从56小时缩短到36小时。完成一样工序的情况下,从这两个推动因素下市场开始对云计算增长放缓的看法有所改观。
以传统公开云行业的占比来说,亚马逊AWS于科技/金融行业客户的占比普遍高于其他同行,所以受到科技行业减成本、不景气的情况影响。而微软azure客户行业范围较广,涉及到不同传统行业。从公开云增长恢复的观点来看,Azure 较优。但由于通用人工智能对(供应端)应用开发人员效率以及对(需求端) AI 应用开发需求都有所提升,我们相信云计算行业将会是整个行业基本面的改善。所以于公有云个股的选择上除了考虑个股基本面外,应同时考虑估值的相对差距进行操作。
图表1: 公有云(季度)按年云业务收入增长
上篇文章已经提及到CRM 等前台的SaaS 软件通过通用人工智能 (generative AI) 应用带来额外收入空间,例如提供更多自动化功能或提供类似co-pilot的通用人工智能服务。我们将会于此文章内为大家分析通用人工智能对于backend后台SAAS软件的需求推动,特别是提供通用人工智能AI 所涉及到的后台支援体系。
矢量搜索是提供生成式AI 服务的核心工具,当中包括涉及到相似度搜索的能力(使用k-最近搜查来搜索最近的量)而为输入的问题(prompt query)提供更为准确的答案。而不同生成式搜索工具之间的性能差别将会影响到AI的准确性,所以vector search的选择上以质量考虑为优先。但由于vector search 主要头部玩家属于大型上市公司(例如: facebookresearch)/ 私有企业 (例如: milvus),所以比较难找到单独的上市个股。
Snowflake主要提供relational database数据库以及数据分析功能,目前主要以relational database关联数据库作为支撑。Snowflake公司最近也公布收购Neeva将会提供生成式AI所需的矢量搜索能力。虽然目前Snowflake没有提及到太多的相关整合(预期将会于6月27号分析师日)提及到相关应用。我们暂时估计Neeva整合后将会能够赋能Snowflake为其他客户企业内部数据进行联天式机器人chatbot style应用,成为公司未来引流新客户或者加大现有客户数据于Snowflake的存放量。但比较需要留意的是snowflake现时行业收入占比中约20%为金融行业以及部份创投VC企业,所以短期受到这些行业的(因为银行信贷危机影响)不景气对使用量(consumption pattern)影响较大。虽然Neeva 收购暂时同贡献不大,但值得留意未来当snowflake neeva为企业客户提供生成式AI chatbot 企业搜索功能时,可能会吸引更多企业将数据存于snowflake。Neeva 过去为一家提供AI 生成式搜索网站,所以市场比neeva 的矢量搜索准确度都比较确定。
图表2:矢量数据搜索过程图
图表3:矢量数据搜索排名
大模型generative AI应用除了需要使用矢量数据库支撑用户搜索外,同时也需要传统的数据库进行额外数据存储。由于generative AI 数据库量可能达到约千亿线级parameters 参数水平,而且可能涉及到图像及文字之间不同格式的组合。所以NoSQL 的数据库可能提供更方便/灵活的存储格式,因为比较不受到传统SQL database表格数据储存格式限制。同时,企业应用更多实时性使用prompt 问答应用,预计将会利好对NoSQL类型的数据库使用量需求。
a.生成式AI chatbot 应用增加用户与应用之间的互动,赋能更多个性化服务以及数据库资料储存。
于用户与应用之间互动加大的趋势下,我们相信会对noSQL类型的数据库需求 (例如: MongoDB文件document-based 数据库) 特别利好。但需要注意MongoDB 最近股价走势已经涨了不少的风险。由于生成式AI 于客户交流的时候,涉及到更多个人化的信息交换。non-relational 数据库能够更便捷地储存用户相关信息。比较有实时性需求的AI chatbot 应用亦会趋向使用NoSQL 数据库,带动mongoDB 数据库需求。根据6sense.com数据,MongoDB 2022年于NoSQL 数据库中的市占率达到45.19% 。MongoDB NoSQL数据库也比较适合于处理非结构化数据。但值得留意Generative AI 人工智能的应用利好将会是续步性,而不是一次性带来巨量增长。所以值得同时留意股价的风险。
图表4﹕ MongoDB使用例子
b.大模型应用同时也衍生更多数据库之间的实时连接需求。
大模型(特别是针对个别企业定制的模型)需要针对公司内部不同系统数据库先进行整合,整合过程中将增加对数据库连接器软件的需求。Confluent 就是一家专门处理数据连接的企业,近期也提到人工智能应用包括chatbot 联天机器人的互动,涉及到实时数据传输,而且当中可能涉及到多用户同时进行的运输量。Confluent kafka就是主要为管理客户数据库之间的连接,普遍大家认为Confluent cloud能够提供更加稳定性强的连接。对于chatbot 联天机器人等前台应用,连接稳定性及实时性将直接影响到客户体验。随着NoSQL 数据库使用场景受惠于Generative AI 应用,将会带来更多的数据库连接器需求。虽然连接器也有部份企业使用内部研发,但kafka被普遍认为能够提供更好的经济效益。
图表5﹕ Confluent (Kafka) 于NATS市场占有率为41.21%
通用生成式人工智能将会衍生更多云计算(公有云)需求,无论是对(供应端)应用开发人员效率提高,或是对(需求端)AI 应用开发需求提高来看,所以估计能够更快结束行业从2022年开始的增速放缓期。这次行业的基本面改善,更多的将会是整个公有云行业的机会。所以我们认为选股也可以从相对股值的角度考虑。值得注意的是,生成式人工智能对于云计算的收入增量不会出现一次性巨量的状况,更多的是续步改善。
对于SaaS 行业的后台应用,通用人工智能的机会更多于矢量搜索以及矢量数据库。大部分主要将非上市公司,有部分公司(例如: snowflake 通过收购)向矢量搜索发展。相信将能够为现有业务带来额外引流。同时数据处理量多元化及实时性也会对个别数据库 (NoSqL- MongoDB)以及数据连接器(Confluent -- Kafka)的需求将来拉动。由于个别股份的涨幅较多(例如: MongoDB),所以应该同时注意对投资的风险进行考量。
以上个股分析纯为个人意见,不构成投资建议。 C 基金目前持有微软 (MSFT) ,谷歌 (GOOG), 亚马逊(AMZN) 相关可能提及个股的长/短仓。
关于鹏格斯投资心得 (Pickers Investment Ideas):鹏格斯投资心得附属于鹏格斯资产管理有限公司 (Pickers Capital Management Limited),由公司的投资研究团队组成。研究范围包括中港美三地上市公司的股票,重点聚焦医疗、新能源,大消费等板块。鹏格斯投资心得秉持「价值投资」的理念,开展行业和企业的深度研究,致力于发现证券市场的投资机会,并与投资者共享研究和交流最新的研究成果 。