2023国内外上术设计最具商业合作价值的向量数据库企业盘点

 

  ChatGPT 的问世重新激活了科技领域,投资活动如雨后春笋般激增,这种激增为市场注入了新的活力。OpenAI 也掀起了一波 AI 变革,让向量数据库越来越受关注。

  简单来说,向量数据库用来存储非结构化数据,例如,文档、图片、视频、音频和纯文本等,在保证100%信息完整的情况下,通过向量嵌入函数来精准描写这些非结构化数据的特征,从而提供查询、删除、修改、元数据过滤等操作。而像SQL、Mysql这样传统的数据库根本无法完成这些操作。

  向量数据库有着巨大的市场空间上术设计,全球目前处于从0-1阶段。预测到2030年,全球向量数据库市场规模有望达到500亿美元,国内向量数据库市场规模有望超过600亿人民币。并且随着市场对 AI 基础设施需求的不断增加,向量数据库预计也将保持强劲的发展势头,将一步步成为未来 AI 技术愿景的重要基石。

  本期将围绕“2023国内外最具商业合作价值的向量数据库领域的企业”进行筛选,最终整理出15家优秀的向量数据库企业,以下排名不分先后。

  北京海量数据技术股份有限公司成立于2007年,是国内首家以数据库为主营业务的主板上市企业。公司十余年来秉承“专注做好数据库”的初心,始终致力于数据库产品的研发、销售和服务。核心产品海量数据库Vastbase系列,拥有完全自主的知识产权,应用满足度高,目前广泛应用于政务、制造、金融、通信、能源、交通等多个重点行业,已成为国产企业级数据库的首选之一。

  墨奇科技是领先的 AI 基础技术和平台公司。自 2016 年创建,始终以“探寻人工智能本身的机理,以创新改变世界”为使命。在这个使命下,墨奇科技致力于构建先进的新型 AI 知识数据库,自动化地处理机器知识,让企业可以便捷的应用人工智能获得数据洞察,加快 AI 时代的智慧产业升级步伐。同时,墨奇基于 AI 知识数据库,构建了能为数十亿人提供保护隐私、安全可靠的下一代身份识别和认证平台,统一物理和数字身份,为建设智慧信用社会提供技术支撑。

  拓尔思信息技术股份有限公司(简称“拓尔思”)成立于1993年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。拓尔思一直坚持“数智+赛道”的发展战略,以优秀的科技能力打造丰富的行业解决方案,为企业、政府实现数字化升级赋能。公司自主研发的TRS大数据平台、 TRS人工智能平台和安全一体化平台,已成为行业领先的数字化基座。同时,公司已建立了大规模的数据和知识资产,正在全面构建云和数据服务生态(SaaS&DaaS)。目前,公司的数智产品与服务已被国内外10000余家企业级用户广泛使用,尤其在企业数字化转型、数字政府、网络内容安全、融媒体、金融科技和开源情报等领域实现了深度应用。

  公司紧跟技术发展新趋势,在向量数据库方面已有布局并投入了研发力量,目前已经形成了技术积累。公司TRS海贝搜索数据库计划引入向量数据的支持能力,目前已经完成核心功能的开发,正处于内测阶段。

  腾讯云是腾讯集团倾力打造的云计算品牌,面向全世界各个国家和地区的政府机构、企业组织和个人开发者,提供全球领先的云计算、大数据、人工智能等技术产品与服务,以卓越的科技能力打造丰富的行业解决方案,构建开放共赢的云端生态,推动产业互联网建设,助力各行各业实现数字化升级。

  腾讯云新一代HCC高性能计算集群,专为大模型训练打造,具备业界最高的3.2T互联带宽,将整体算力性能提升3倍;即将推出的腾讯云向量数据库(Tencent Cloud VectorDB),源自腾讯每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适合AI运算、检索,数据接入AI效率提升10倍。

  上海爱可生信息技术股份有限公司是国内开源数据库解决方案领导者、工业互联网高维数据应用创新者。爱可生为产业互联网创新应用提供高性价比、快速落地实现的多数据库管理平台、分布式数据库系统、数据库容器云平台、多地多中心跨云容灾等解决方案。

  在工业互联网相关垂直行业,深入分析数据价值,构建数据中台和业务中台的基础软件PaaS平台,用数据技术驱动企业高质量增长。公司产品已被广泛应用于各行业,累计用户超过400家,其中包括工商银行、中国人寿、中国太保、国家电网、上汽集团、中国移动、华为等50多家世界五百强企业。

  TensorDB作为爱可生向量数据库的核心产品,不仅能够高效地存储和管理海量向量数据,还能够快速地进行向量检索和相似度计算,满足了AI应用中对于向量数据处理的高要求。

  星环科技致力于打造企业级大数据基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务,构建明日数据世界。经过多年自主研发上术设计,星环科技建立了多个产品系列:一站式大数据基础平台TDH、分布式分析型数据库ArgoDB及交易型数据库KunDB、基于容器的智能数据云平台TDC、大数据开发工具TDS、智能分析工具Sophon和超融合大数据一体机TxData Appliance 等,并拥有多项专利技术。目前公司产品已经在十几个行业应用落地,拥有超过1400家终端用户。2022年,星环科技成为全球首个通过 TPCx-AI基准测试及官方审计的软件厂商,单节点性能全球第一 。2022年10月,成功登陆上交所科创板。

  星环科技分布式向量数据库Transwarp Hippo于今年6月正式发布,致力于拓展大语言模型时间和空间维度。

  Zilliz 成立于中国上海,总部在美国硅谷,于2019 年开源了全球首个向量数据库产品Milvus,它在GitHub 上获得了超过 1.8 万颗 Star,在全球拥有超过 1000 家企业用户,成为目前全球最流行的开源向量数据库。而早在2022 年,Zilliz 就完成了累计超过1.03 亿美金的 B 轮融资,估值达到惊人的6亿美金。

  公司发布了向量数据库的云服务,于2022年9月发布了Zilliz Cloud的早期预览版,2023年3月发布正式版本。我们公司会进入到一个新阶段,从一个开源的技术公司,变成一个开源且面向商业化、拥抱商业化的公司。

  南京云创大数据科技股份有限公司成立于2011年3月,聚焦于大数据存储与智能处理业务,是集人工智能、大数据、云计算、云存储技术于一体的高新技术企业,是北交所首批上市公司。针对爆炸式增长的大数据需求,云创大数据研发了自主知识产权的大数据与人工智能产品线。cStor 超低功耗云存储系统,单机架容量超5PB,10倍节能,使用寿命可长达20年。dBrain数据大脑平台能够跨地域跨系统集成异构数据资源,进行智能数据治理和自动数据挖掘,深度发掘数据的应用价值。

  公司的“eVector向量计算一体机”相当于从硬件层面实现了向量数据库,主要针对特征向量计算场景,用优化后的CPU代替GPU,解决高维向量计算中的算力不足的卡脖子难题。

  创意信息技术股份有限公司成立于1996年,于2014年在深交所上市,经过多年发展,公司已成为国内极少数具备数字化转型全栈核心能力的企业之一,旗下拥有操作系统、数据库、大数据、5G等自主可控核心技术产品,卫星互联网、人工智能、物联网、云/边缘计算等信息技术及解决方案,同时投资布局工业CAD软件等硬核技术产品,已为运营商、能源、金融、政府、交通等领域超过700家大型政企客户提供数字化转型服务。

  旗下子公司万里开源核心产品分布式向量数据库GreatDB是一款面向云计算时代的分布式事务型数据库。

  厦门市美亚柏科信息股份有限公司成立于1999年9月22日,总部位于厦门市软件园二期,是国内电子数据取证行业龙头和公共安全大数据领先企业、网络空间安全与社会治理领域国家队,国投智能控股子公司,国务院国有资产监督管理委员会为公司实际控制人。

  美亚柏科拥有自主技术内核,以自主研发的乾坤大数据操作系统为技术基座,布局“电子数据取证、公共安全大数据、新网络空间安全、数字政务与企业数字化”四大业务板块,为公检法、政府机关和企事业单位提供一站式综合解决方案,业务范围覆盖全国各省、市、自治区及部分“一带一路”沿线国家。

  美亚柏科掌握针对向量数据的提取、优化、检索等计算技术,并已将相关技术应用于公司“慧视”视图中台等相关产品。

  Chroma获得1800万美元种子轮融资,Chroma由Jeff Huber和Anton Troynikov共同创建,Jeff是连续创业者,他的上一家企业获得了YC投资,做的是低成本的假肢制造。Anton Troynikov也是连续创业者,同时长期担任过Nuro和Meta的计算机视觉工程师。作为向量数据库研发商,Chroma的主要产品是开源的嵌入式向量数据库。

  4月28日,向量数据库平台Pinecone宣布获得1亿美元(约7亿元)B轮融资,由Andreessen Horowitz领投,ICONIQ Growth等跟投。根据公开资料显示,Pinecone创立于2019年总部位于美国纽约,主要提供向量数据库服务。Pinecone曾在2021年1月27日,获得1000万美元种子轮融资;2022年3月29日获得2800万美元A轮融资。开发者通过API就能轻松将向量搜索功能添加到应用程序中。Pinecone联合创始人兼首席执行官Edo Liberty则直言,如果没有ChatGPT的出现,我们根本不可能获得巨额融资。

  Vespa由Oath开发,发布之初被定义为一款开源的“大数据处理和服务引擎”。2003年2月2日,Yahoo以1亿美元收购Vespa前身——挪威搜索引擎公司 AlltheWeb,2017年9月28日,由Yahoo和AOL 业务合并后诞生的公司 Oath 宣布开源 Vespa,并将代码托管于GitHub。

  Vespa在多台机器上分布数据和计算任务,避免了单点 master 的瓶颈。Vespa 赋予了开发者将任意大小数据集和模型填充进服务系统的能力,而且可以实时地得到计算结果,带来更好的用户体验,而且成本更低,比预计算方式具有更低的复杂度。而且,开发者可以与复杂的计算展开实时的交互,不需要启动离线作业或反复回过头来检查结果。

  Qdrant成立于2021年,它针对人工智能软件开发人员,提供用于非结构化数据的开源向量搜索引擎和数据库。

  Qdrant认为向量数据库已成为新人工智能技术堆栈的基本构建块。它们使开发人员通过实时和真实世界的数据来扩展ChatGPT等基于大语言模型的应用程序的“知识库”,从而构建更先进的应用程序。

  北京企名片科技有限公司是一家科技创新服务平台,发现并推广科技企业,致力于帮助科技企业提高品牌影响力和获得商业合作机会,也为政府/金融机构/大型企业/咨询企业提供查企业、找企业、联系企业的数据产品,同时为科技创新企业提供提高管理与效率的工具。奖杯需求,联系:qmpEddie。返回搜狐,查看更多开云上术设计开云上术设计开云上术设计

搜索