企业研报

安徽听见科技有限公司:智慧办公SaaS平台开发、数字软件与工业服务专精特新企业档案

安徽听见科技有限公司 · 安徽省 · 发布:2026-06-13T16:04:22

工业软件与信息服务安徽省数字软件与工业服务第六批
安徽听见科技有限公司主要提供基于语音识别与自然语言处理的智慧办公SaaS产品,位于“电子信息与数字技术”产业链的“数字软件与工业服务”环节,属于上游的技术服务与软件应用层
企业安徽听见科技有限公司
地区 / 行业安徽省 · 工业软件与信息服务
认定批次第六批
公开来源3 条

阅读路径

横向比较

省内样本887 家地区企业基数
同城样本332 家本地产业密度
同业样本5226 家全国行业口径
链条位置1329 家全国同位置企业
省内同业225 家区域赛道样本
专利分位63行业样本排序

安徽省新一代信息技术样本共有 225 家,安徽听见科技有限公司适合放在省内同行、同批次和同链条三个口径中比较。

安徽听见科技有限公司处在电子信息与数字技术的数字软件与工业服务环节,全国同一位置样本为 1329 家。

专利数为 111 件,行业样本中位数为 81 件,行业分位约 63。

产业链上下游

相关企业

同省同行业

同城企业

同产业链位置

一、企业速览

企业基础信息:公司名称:安徽听见科技有限公司;地区:安徽省合肥市高新技术产业开发区;行业:工业软件与信息服务;成立时间:2016-03-16;注册资本:2000万元;员工规模:141 人;专利总数:111 件;专精特新认定:2024年 第六批;上市状态:未上市。

安徽听见科技有限公司主要提供基于语音识别与自然语言处理的智慧办公SaaS产品,位于“电子信息与数字技术”产业链的“数字软件与工业服务”环节,属于上游的技术服务与软件应用层。

二、主营产品与产业链定位

安徽听见科技的核心产品体系包括“讯飞听见”、“讯飞写作”、“讯飞同传”和“讯飞会议”等,本质上是将语音信号转化为可编辑、可检索、可共享的文本数据,并在此基础上提供智能写作和实时翻译服务。

在产业链条中,这类企业扮演着“数据入口与处理枢纽”的角色。具体来看:

  • 解决的问题: 传统会议、访谈、演讲场景中,信息记录依赖人工速记,效率低、成本高、易出错。听见科技通过AI技术解决了非结构化语音信息向结构化文本数据低成本、高效率转化的问题,并进一步利用自然语言处理技术辅助内容生成与翻译。
  • 产业链位置与上下游关系:
  • 上游: 主要依赖于算力基础设施(如GPU服务器,典型供应商为英伟达/华为昇腾)和云服务资源(如阿里云、华为云、腾讯云,行业共识)。其核心技术(语音识别、自然语言处理)所需的算法训练和推理,高度依赖上游硬件和云平台的算力支撑,以及底层操作系统和数据库(如Linux、麒麟OS、达梦数据库等)的适配性。
  • 下游: 终端客户覆盖广泛,包括但不限于:
  • 政府与公共事业: 用于会议记录、公检法审讯系统、数字政务等。
  • 大型企业: 用于企业内部会议、跨国会议同传、知识管理等。
  • 媒体与内容创作: 用于音视频内容转写、字幕生成、文案辅助写作。
  • 个人用户: 提供SaaS订阅服务。

在同一条产业链中,上游的硬件厂商(如中科曙光、浪潮信息)提供物理基础,而听见科技这类企业则提供具体的应用解决方案,将硬件和云计算能力进行封装,转化为用户可感知的、易用的软件产品。

三、核心工序与技术依赖

对于一家以AI SaaS为主营业务的专精特新企业,其核心“生产工序”实际上是软件研发和数据服务的流程。结合行业共识,其关键工序如下:

1. 声学模型与语言模型训练: 这是语音识别系统的核心。需要收集超过10万小时的标注音频数据(涵盖不同口音、噪声环境、语速),使用深度学习框架(如TensorFlow、PyTorch)在海量GPU集群上进行训练,典型模型参数量已达数亿级。

2. 端到端语音识别系统构建: 将声学模型、语言模型和发音词典级联或统一为端到端的神经网络模型,要求实时率(RTF)低于0.3(即处理1秒音频耗时小于0.3秒),字错率(CER)在通用场景下低于5%,在专业领域(如法律、医疗)低于3%

3. 自然语言处理(NLP)与文本后处理: 对语音识别输出的原始文本进行智能断句、标点添加、说话人分离、语义纠错和摘要生成。这是“讯飞写作”和智能会议纪要的基础,需要大量规则引擎和预训练语言模型的配合。

4. 多语种与方言适配: 扩展系统支持的语言和方言种类(如中文普通话、粤语、英语、日语、韩语等),需要对应语言的平行语料库和母语标注团队进行定制化适配。

5. SaaS平台工程化与运维: 将AI能力封装成可调用的API或微服务,构建高并发、低延迟的在线服务平台,确保99.9%的服务可用性,并进行持续的性能监控和模型迭代。

上游关键原材料和设备的典型来源:

材料/设备典型供应商(国产)典型供应商(进口)国产化程度
GPU服务器华为昇腾、寒武纪(行业共识)英伟达(NVIDIA)(行业共识)中:训练端仍以N卡为主,推理端国产替代加速
云基础服务阿里云、华为云、腾讯云(行业共识)亚马逊AWS、微软Azure(行业共识)高:国内主流SaaS企业首选国产云
AI开发框架百度飞桨(PaddlePaddle)、华为MindSpore(行业共识)Google TensorFlow、Meta PyTorch(行业共识)中:国产框架生态仍在追赶
数据标注服务海天瑞声、数据堂、标贝科技(行业共识)Appen(行业共识)高:国内人力成本优势和行业集中度高

安徽听见科技的定位: 从业务范围和111件专利来看,公司并不涉足上游硬件制造,而是站在巨人的肩膀上,专注于AI模型在SaaS场景的深度定制和产品化。其核心竞争力在于场景化落地能力(如为会议、同传、写作等具体场景提供优化方案)和规模化用户服务能力(累计用户1亿)。其技术专利方向预计集中在增量创新上,例如:特定噪声环境下的语音识别增强算法、跨语言翻译的并行计算优化、针对特定行业术语的模型微调方法等。

四、竞争格局

数字软件与智能语音赛道竞争激烈。全国处于同一产业链位置的企业共1578家,安徽听见科技是其中一员。其主要竞争对手包括:

竞争对手规模与特点差异点
科大讯飞股份有限公司(300230)行业巨头,语音AI技术的老牌领军者。员工超万人,年营收超200亿。技术覆盖最广,从芯片到云平台到行业解决方案。科大讯飞本身也是听见科技的股东和技术来源方之一。听见科技是独立运营的子公司,更聚焦于SaaS和智慧办公生态。
北京搜狗科技发展有限公司在输入法和语音识别领域有深厚积累。用户基数庞大(日活数亿),但在G端和B端深度行业方案上不如听见科技。搜狗更偏向C端工具属性和通用搜索场景。
上海云之驾信息科技有限公司(腾讯会议)依托微信和腾讯云生态,旗下腾讯会议是超大规模视频会议平台。语音转写为集成功能。腾讯会议是平台级产品,语音类转写只是其功能模块,而非核心产品线。听见科技的产品更深、更专。
深圳加一健康科技有限公司另一家专精特新企业,专注于医疗领域语音录入方案,细分性强。业务重叠主要在医疗交流场景,听见科技的通用办公和音视频转写覆盖更宽。

竞争核心维度:

1. 技术引擎的识别率与实时性: 这是基础门槛,所有竞争者都必须不断优化。

2. 场景化深度适配能力: 能否为特定行业(如政府、金融、医疗、教育)提供开箱即用的高精度模型和定制化服务。

3. SaaS产品体验与付费转化率: 1亿用户规模巨大,但如何通过免费用户转化为付费订阅用户,是商业化的关键。竞争者都面临类似的挑战。

4. 品牌与生态整合: 科大讯飞的品牌效应、腾讯会议的生态整合能力是强有力的壁垒。

专利维度: 安徽听见科技专利111件,高于行业同类型企业中位数89件,表明其在技术研发投入上处于行业平均水平之上,具备一定的技术创新积累。

五、护城河判断

  • 技术壁垒: 111件专利是其技术护城河的一个数量化证明,但需要留意专利构成(发明专利占比)。考虑到公司以SaaS模式运营,持续的模型迭代和场景优化能力比单纯的专利数量更关键。其技术壁垒主要体现在声学/语言模型的行业适配性优化以及端到端产品化能力上,并非底层算法的原始创新。
  • 客户壁垒:
  • 验证周期: 政府、大型企业等B端客户(行业共识)采购决策流程长,通常需要3-6个月甚至更长的POC(概念验证)和招投标过程。一旦集成到客户的OA或业务系统中,替换成本高。
  • 切换成本: C端用户切换成本较低(换一个App即可);B端用户基于单点登录、数据存储方案、私有化部署等深度绑定,切换成本较高。这构成了重要的护城河。安徽听见科技在B端市场的深耕有助于构建这一壁垒。
  • 规模壁垒:
  • 141人的团队属于轻资产、高技术密集型企业。这个规模可以支撑一套完整的SaaS产品研发、运营和客户服务,但对于同时开拓多个行业垂直方案和进行规模化复杂定制化项目来说,交付能力可能受限。其核心能力在于利用技术杠杆,以少人团队服务大规模用户(1亿C端用户)。
  • 认定价值: 2024年(第六批)的专精特新“小巨人”认定,在当前政策环境下,意味着企业在细分市场具备“专业化、精细化、特色化、新颖化”优势。这不仅是荣誉,更直接关联到:1)地方政府在税收、研发补贴、人才引进等方面的优先支持;2)企业在参与政府/大型国企招投标时获得的加分项。对于安徽听见科技这样背靠科大讯飞、且在声谷的企业,这项认定能帮助其强化独立品牌辨识度和市场信任度。

六、风险与机会

  • 行业风险:

1. 技术同质化严重: 智能语音和NLP领域,开源模型(如Whisper、ChatGLM等)的繁荣正在不断拉低技术门槛。所有SaaS企业都在与开源模型赛跑,比拼的焦点从“能不能做”转向“谁做得更好、更便宜、更安全”。

2. 大模型冲击: 以GPT-4为代表的通用大模型具备了很强的基础理解与生成能力,传统的、针对单一场景的小模型可能面临被替代的风险。企业需要找到通用大模型无法有效覆盖的“长尾场景”或“垂直专业场景”作为自己的根据地。

3. 数据安全与隐私合规: 处理语音和文字内容,尤其涉及B端客户机密,对数据不出境、私有化部署、本地化模型加密等要求极高。任何数据泄露事件都可能摧毁一家SaaS公司的声誉。

  • 公司风险:

1. 资本结构单一: 公司类型为“非自然人投资或控股的法人独资”,结合科大讯飞的背景,意味着其资金来源和发展战略高度依赖单一母公司或集团。作为未上市企业,外部融资渠道可能受限,独立抵御行业风险的能力有待观察。

2. 员工规模偏小: 141人的规模,在面对需要大量人力和时间进行模型标注、工程化支持和定制化方案交付的市场时,可能成为瓶颈。过度依赖技术杠杆(SaaS)与特定客户需求之间的冲突是潜在风险。

3. 公开证据密度低: 除了官网和工商信息,本次提供的公开证据极少(仅指出入口)。对于一家声称拥有1亿用户且专注B端业务的公司,缺乏典型客户案例、行业奖项或与大型系统集成商的合作公告,增加了对其真实市场渗透率判断的模糊性。

  • 机会窗口:

1. 信创与国产替代: 在政府、金融、能源等关键行业,信创政策强制要求使用国产软件和硬件。安徽听见科技作为中国声谷核心企业,其产品天然具备“国产、自主可控”的标签。这是其从科大讯飞的竞争体系中脱颖而出,获取增量B端市场的绝佳窗口。

2. AI办公向“内容生成”升级: “讯飞写作”的推出,标志着其产品从简单的“记录”向“辅助创作”延伸。随着AIGC内容的爆发,企业对于AI写作助手、营销文案生成、营销自动化的需求正在急速增长。如果能利用现有用户基础,将“讯飞听见”的入口流量有效转化为“内容生成”服务的付费用户,将打开新的增长曲线。

本研报基于企业数据库字段及公开资料整理,仅供产业研究参考,不构成投资建议、商业背书或专精特新申报结果判断。涉及未披露的客户、收入、利润、产能、良率、市场份额等,本文不作推断。