企业研报

北京科杰科技有限公司:企业级Data&AI技术研发、数字软件与工业服务专精特新企业档案

北京科杰科技有限公司 · 北京市 · 发布:2026-06-12T19:03:22

中间件/数据治理基础软件北京市数字软件与工业服务第五批
北京科杰科技有限公司,北京市 · 中间件/数据治理基础软件方向,关注产业链位置、知识产权、经营规模与公开资料核验。
企业北京科杰科技有限公司
地区 / 行业北京市 · 中间件/数据治理基础软件
认定批次第五批
公开来源3 条

阅读路径

横向比较

省内样本1351 家地区企业基数
同城样本1329 家本地产业密度
同业样本5226 家全国行业口径
链条位置1329 家全国同位置企业
省内同业615 家区域赛道样本
专利分位85行业样本排序

北京市新一代信息技术样本共有 615 家,北京科杰科技有限公司适合放在省内同行、同批次和同链条三个口径中比较。

北京科杰科技有限公司处在电子信息与数字技术的数字软件与工业服务环节,全国同一位置样本为 1329 家。

专利数为 224 件,行业样本中位数为 81 件,行业分位约 85。

产业链上下游

相关企业

同省同行业

同城企业

同产业链位置

一、企业速览

企业基础信息:公司名称:北京科杰科技有限公司;地区:北京市海淀区;行业方向:中间件/数据治理基础软件(电子信息与数字技术);成立时间:2019-06-03;注册资本:1431.4838万元人民币;员工规模:124人;专利总数:224件;认定批次:2023年第五批专精特新“小巨人”;上市状态:未上市。

北京科杰科技成立于2019年,专注于Data&AI基础设施软件,核心产品为KeenData Lakehouse湖仓一体平台。在产业链中,它处于“电子信息与数字技术”链条的“数字软件与工业服务”环节,定位为向大型企业提供从数据采集、治理到人工智能(AI)模型开发与落地的全栈工具。

二、主营产品与产业链定位

1. 具体产品与服务

科杰科技的核心产品是KeenData Lakehouse,这是一个企业级的AI数据基础设施软件平台。该平台并非单一工具,而是一个集成了数据集成管理、数据治理、数据资产管理、分析建模、AI模型开发平台以及AI Agent(智能代理)开发平台等功能的一体化方案。其核心价值在于解决大型组织在数据到AI落地过程中的“最后一公里”问题:即如何高效地将分散、混乱的原始数据转化为可直接用于AI训练和推理的高质量数据资产。

2. 解决的核心问题与产业链位置

在“电子信息与数字技术”产业链中,“数字软件与工业服务”环节扮演着“使能者”的角色。上游是提供算力的硬件厂商(如服务器、GPU芯片)和云服务商;下游则是各类需要进行数字化转型和AI应用部署的实体企业。

科杰科技解决的核心问题是“数据到AI的转化效率”。具体来说:

  • 对上游(算力与存储): 科杰的产品需要依赖底层的云基础设施(如AWS、阿里云、华为云)或本地服务器集群(如浪潮、新华三)提供算力和存储资源。其价值在于,通过KeenData Lakehouse的优化引擎,让上层AI应用更高效地调用底层算力,减少昂贵的GPU算力浪费。
  • 对下游(终端客户): 下游客户是典型的大型组织,如企业简介中提及的中国联通(通信运营商)、中国石化(能源化工)、中国一汽(先进制造)。这些企业的共同特点是数据规模大、数据源异构(ERP、CRM、IoT、记录等)、数据治理需求高且AI应用场景复杂。科杰的平台为这些客户提供了一个统一的数据底座,使得业务部门能够无需关心底层数据工程,直接基于平台进行模型开发和Agent搭建。

3. 与产业链其他环节的关系

科杰科技的产品介于通用云计算/硬件与垂直行业应用软件之间。它不是直接与SAP、用友等应用软件商竞争,而是为这些应用层软件和AI应用提供高质量的数据支撑。同时,它与Snowflake(海外)、阿里云DataWorks、华为云GaussDB等数据平台厂商存在直接竞争或互补关系。在AI Agent风口下,科杰的AI Agent开发平台使其向下游的应用层进一步延伸,试图从“数据底座”拓展为“智能应用开发基座”。

三、核心工序与技术依赖

1. 关键研发与交付工序(行业共识)

对于像科杰科技这样的“中间件/数据治理基础软件”企业,其核心工序并非传统制造业的物理加工,而是软件研发、集成与部署。典型工序包括:

  • (1)数据引擎设计与优化: 这是产品的核心。涉及湖仓一体架构设计、存储引擎(如Parquet/ORC格式优化)、计算引擎(如Spark/Trino/Flink的SQL优化与资源调度)。关键参数包括:TPC-DS等基准测试下的查询响应时间、并发处理能力、以及数据压缩比。这决定了产品的性能天花板。
  • (2)数据治理DQC(数据质量检查)规则库开发: 开发可配置的数据质量检验规则,覆盖完整性、一致性、准确性、及时性等维度。技术要求包括:支持海量数据下的规则执行效率、无侵入式数据探查、以及血缘分析的自动追踪。
  • (3)AI模型与Agent框架集成: 将开源机器学习框架(如PyTorch、TensorFlow)和LLM(大语言模型)推理框架(如vLLM)集成到平台中,提供模型训练、部署、监控的端到端功能。关键挑战在于模型与数据的“近计算”调度,以及支持RAG(检索增强生成)流程的向量数据库集成。
  • (4)客户定制化交付: 大型客户(如国央企)通常要求私有化部署。工序包括:环境适配(与国产化硬件如鲲鹏、飞腾芯片,操作系统如麒麟、统信适配)、性能调优、与客户现有业务系统(ERP、OA等)的数据接口开发。
  • (5)安全与权限系统构建: 设计多租户、细粒度的数据权限管控(行级、列级脱敏)、审计记录和数据加密方案。这是服务大型政企客户的准入要求。

2. 上游关键供应商(行业共识)

材料/技术典型供应商(国产)典型供应商(进口)国产化程度
云计算/算力底座阿里云、华为云、腾讯云、青云AWS、Azure、Google Cloud高(国内主要需求)
服务器硬件浪潮、新华三、中科曙光Dell、HPE
GPU/NPU芯片华为昇腾、寒武纪、海光NVIDIA正在加速追赶(整体偏低)
基础开源框架无(主要基于开源)Apache Spark、Flink、Trino、Kubernetes、PyTorch无(开源生态)
数据库存储引擎星环科技、OceanBase、TiDB(PingCAP)Snowflake、Databricks中(国产替代空间大)

3. 科杰科技的具体定位

基于其主营记录(Data&AI基础设施软件)和224件专利的高密度输出,可以判断科杰科技在产业链中的定位是“核心数据中间件”的自主研发者。它并非简单的集成商,而是在湖仓一体、数据治理和AI Native架构上拥有自研能力。其产品直面国际领先的Databricks和Snowflake模式,并试图在信创环境下实现国产替代。高额的专利数(224件)表明其技术护城河可能集中在数据虚拟化查询、元数据管理、以及AI工作流调度等关键算法层面。

四、竞争格局

该赛道“数字软件与工业服务”全国共有1578家同类企业,竞争异常激烈。竞争主要围绕以下几个维度展开:

1. 数据底座性能: 查询速度、多源异构数据接入能力、海量数据下的稳定性。

2. AI与数据融合深度: 能否原生支持AI模型开发(AutoML、Notebook)、MLOps(机器学习运维)和LLM的落地。

3. 信创适配与国央企背书: 对于服务于大型政企的玩家而言,能否适配国产软硬件生态并获得标杆项目至关重要。

4. 易用性与工具链完整度: 是否能让数据分析师、数据科学家、业务人员都能高效使用,而非仅限专业工程师。

主要竞争对手(列举2-3家):

  • 星环科技(Transwarp): 上海上市公司,成立于2013年,规模远大于科杰科技(员工千人以上)。其产品线(TDH、Sophon等)更全面,覆盖数据库、数据仓库、数据湖和AI平台。星环在国产大数据平台市场占据领先地位,是科杰科技在国内最具对标意义的直接竞争对手。
  • 偶数科技(Oushu): 北京企业,专注于新一代云原生数据库和数据湖仓。其核心产品Oushu Lake在性能上有一定知名度,获得红杉等知名机构投资。更侧重于底层数据库引擎和湖仓一体,AI Agent方面布局相对较弱。
  • Databricks(海外): 美国公司,是全球湖仓一体和Data+AI概念的创始者。科杰科技的产品理念与其高度一致。在海外市场(如东南亚、日本、中东),科杰直接面对Databricks的竞争。在国内,受信创政策庇护,科杰有本地化优势。

专利维度分析:

北京科杰科技有限公司拥有224件专利,是行业专利数中位数(89件)的2.5倍。这一数据表明其在技术研发上的高投入。通常,软硬件一体化或算法密集型企业专利产出更高。224件专利很可能分布在:数据湖存储与查询优化(基础专利)、数据血缘与治理算法、以及AI模型与数据平台集成接口(应用专利)三个层面。这一专利密度在北京市该细分行业(仅有3家样本)中处于绝对领先地位,构筑了其核心的技术壁垒。

五、护城河判断

1. 技术壁垒:高。

224件专利直接反映其技术密度。在Data+AI领域,许多公司是开源组件的“简单搭积木”,而科杰很可能在底层调度、查询优化和数据治理元模型上拥有自主知识产权。其“原生AI架构”的描述,若属实,则意味着在数据与模型的协同上较传统数据仓库厂商有代际优势。

2. 客户壁垒:中高。

数字软件与工业服务环节具有极高客户壁垒(行业共识)。

  • 替换成本极高: 大型企业(如名录中的“三桶油”、“三大运营商”)一旦选定数据平台,进行数据集成、ETL(数据抽取转换加载)、报表和模型开发后,更换基座的成本(数据迁移、业务改造、人员培训)极其高昂,甚至超过初次采购成本。
  • 验证周期长: 从POC(概念验证)到正式采购、部署、再到全面上线,通常需要6-18个月。已服务“中国联通、中国石化、中国一汽”等头部客户,本身就是极强的客户背书和信任状。
  • 信创门槛: 服务国央企必须通过信创认证,这形成了天然的进入壁垒。

3. 规模壁垒:当前偏低。

124人的团队规模在To B软件企业中属于早期阶段。这个体量通常意味着:

  • 研发力量强劲(可能超过50%),但销售、售前、交付团队(客服、部署、运维)相对单薄。
  • 能同时支撑的大型项目数量有限。假设一个大型项目需要3-5人驻场实现,124人的团队一次最多支撑20-30个并行项目。未来若要拓展更多客户,可能需要大规模扩充交付团队,这对现金流和公司管理是巨大挑战。

4. 认定价值:

2023年第五批专精特新“小巨人”是国家级资质认证。科杰科技在2024年进一步入选国家级重点“小巨人”,这意味其不仅获得了官方对技术先进性和市场地位的认可,更有望获得中央和地方财政支持(如设备更新补贴、技改基金投资、上市绿色通道等)。在当前政策环境下,这是企业获取国家级项目订单、与大型国央企合作的重要敲门砖。

六、风险与机会

1. 行业风险

  • 巨头碾压与开源冲击: 国内云厂商(阿里、华为、腾讯)正在大力推广自己的数据平台产品,并常以低价甚至免费策略抢占企业级市场。同时,云原生开源生态(如Apache Doris、ClickHouse)的快速成熟,降低了企业自建数据平台的成本,挤压了商业中间件厂商的生存空间。
  • 信创投资增速放缓: 市场普遍预期,前几年大规模的信创“替换”浪潮(硬件+基础软件)已过高峰期,后续将进入“平稳运行”阶段。这意味着以大客户项目驱动增长的科杰科技可能面临新增订单增速放缓的风险。
  • AI泡沫与落地难: 如科杰董事长所言,“当前生成式AI投资效益不明显的主因是数据基础设施不足”。这既是机会也是风险。如果企业客户对AI投入趋于谨慎,优先缩减非核心的“数据基础设施”采购,科杰将承受压力。

2. 公司风险

  • 团队规模与客户复杂度不匹配: 124人的团队服务“中国石化”级别的客户,其技术支撑和售后响应能力面临严峻考验。大客户一旦出现服务事故,可能引发连锁负面反应。
  • 商业模式与现金流: 注册资本1431.48万元,实缴资本仅460.08万元。这种“大注册、小实缴”的结构说明公司历史上的投资注入可能不多。作为未上市的软件企业,若主要收入来自大项目回款慢的国央企,现金流压力将非常突出。财务数据(收入/利润)未披露,这一风险无法定量评估,但必须警惕。
  • 创始人背景单一: 信息显示董事长于洋是法定代表人。公司是否是典型的技术创始人驱动?在To B领域,仅有技术而无强大销售和市场能力的公司,成长天花板明显。

3. 机会窗口

  • AI Agent市场爆发: 当前市场正处于从“大模型”到“智能体(Agent)”落地的窗口期。科杰科技的核心产品“AI agent开发平台”正好切中企业构建基于数据的智能客服、智能运维、流程自动化等应用的需求。谁能将数据治理好、谁能让Agent安全高效地使用企业数据,谁就掌握了话语权。科杰的高质量数据底座是其差异化优势。
  • 出海与“一带一路”数字化: 科杰已明确在东南亚、日本、中东布局。在海外市场,它面对的是Databricks和云厂商的竞争,但价格可能更具优势,且能提供更定制化的私有部署服务。对于中东、东南亚等新兴市场大型企业的数字化转型需求,这是一块潜在的增量市场。

本研报基于企业数据库字段及公开资料整理,仅供产业研究参考,不构成投资建议、商业背书或专精特新申报结果判断。涉及未披露的客户、收入、利润、产能、良率、市场份额等,本文不作推断。