KnowFlow 2025 年度回顾:一群中年程序员的创业之路
前言
2025 年即将进入尾声。
这一年里,一种强烈的冲动始终在心里涌动—— 想把这一年的创业经历,以及过程中真实踩过的坑、做过的判断、得到的经验教训,完整地记录下来。
在这个时间节点上,给自己一个交代。
回头看清来路,才能更好地走向下一段。
背景
我本人程序员出身,中年宅男一枚。
早些年在京东、讯飞、VIPABC 等公司工作, 技术路径也比较典型: 从 Android 移动端,到 软硬结合产品(翻译机、座舱等), 再到后期聚焦 大数据领域的数据采集、治理和用户行为分析。
今年,在一个并非刻意规划的契机下, 我和几位同样背景的伙伴,开始投身 知识库产品 的研发。
团队规模不大,4~5 人, 几乎清一色都是程序员。
我对 "程序员" 的一个长期不适
坦白说,我一直对一种常见的程序员画像感到不适:
- 精通或熟悉某一端语言
- 按产品经理、项目经理的规划推进需求
- 追求技术细节的极致,却很少参与方向决策
- 对产品成败没有真正的决定权
整个过程是被动的, 甚至连开发节奏都不是自己说了算。
我能理解,这在国内的组织结构里很常见, 但我始终不太认同。
在我理想中的状态里:
程序员是成年人,应该对产品负责,对方向负责,也对结果负责。
我们应该有能力、也有权利去:
- 决定做什么功能
- 决定产品原型和交互方式
- 决定技术方案和研发节奏
- 甚至自己去卖产品、聊客户、做售前售后
尤其是在 AI 时代, 工具在降低门槛,能力边界在被不断拓宽。
为什么要给自己设限?
于是,一群中年程序员的"浪漫之旅",就这样开始了。
为什么选择知识库
选择知识库,并不是追热点。
恰恰相反,这是一个相对冷门、但确定性很高的方向。
原因主要有三点:
第一,团队基因匹配。 我们长期从事数据采集与数据治理工作, 而知识库,本质上就是非结构化数据治理能力的延伸。
第二,对趋势的判断。 在 2024 年底,我们做过一次比较系统的判断: 2025 年,很可能是 Agent 集中爆发的一年。
但 Agent 强依赖行业 Know-how 和业务深度, 对于一个小团队来说,投入产出并不匹配。
第三,企业 AI 路径绑不开。 不论 Agent 如何发展, 企业最终都绑不开对自身数据的理解和利用。
知识库不是风口,但它是地基。
为什么选择基于 RAGFlow 二次开发
方向明确之后,团队内部其实有过一轮不小的分歧:
- 从 0 到 1 全自研:完全可控,但重复造轮子
- 基于开源二开:效率高,但要承受黑盒和适配成本
最终促成共识的,是对产品定位的重新确认:
做私有化场景下,最准确的知识库。
围绕这个目标,我们做了非常现实的评估:
- 从 0 到 1 做一个知识库 Demo,并不难
- 但要做到业内较高的准确率,需要大量长期积累
在多个开源方案中,RAGFlow 在准确性上的口碑相对突出; 但同时也存在配置复杂、工程深度不足、企业级能力薄弱等问题。
这恰恰给了我们机会。
在横向对比了 QAnything、FastGPT、MaxKB 等方案后, 我们最终选择以 RAGFlow 为基础进行二次开发。
真实企业眼中的 RAG 痛点
在立项之后,我们通过以往积累的人脉, 和多位企业负责人做了深入交流。
结论非常一致。
幻觉,本质是准确率问题
在知识库场景下, 企业并不怕模型"不够聪明", 怕的是答错了,还说得很确定。
尽管 RAGFlow 已在分块预览、引用标注等方面做了不少努力, 但受限于文档解析、分块策略、检索链路和上下文长度, 幻觉问题依然存在。
私有化部署,是系统工程
RAG 系统对环境极其挑剔:
- GPU 显存与架构
- NVIDIA Driver / CUDA / PyTorch
- nvidia-container-toolkit
- x86 / ARM / 国产信创体系
很多问题,不是"能不能跑", 而是 能不能在生产环境稳定跑。
工程化能力,决定能不能上线
行业里有句话很真实:
RAG POC 无可挑剔,一上生产就废。
企业愿意花人力提升准确率、做人工修正, 但不接受粗糙的文档解析和不可评估的问答效果。
企业级能力不是"可选项"
RBAC 权限管理、 企业微信 / 钉钉 / Dify 对接, 这些不应该只是解决方案, 而应该是产品本身的一部分。
KnowFlow 的产品取舍
围绕上述问题,我们做了一些明确取舍。
- 引入多种离线 OCR 引擎,提升文档解析质量
- 针对不同文档结构,设计多种分块策略
- 补齐工程化能力,而不是一味追模型
- 多模态能力优先解决真实使用场景
产品定位也逐渐清晰下来:
做私有化场景下,准确、可靠、可落地的知识库产品。
从 MVP 到真实用户
打磨 MVP
2025 年 3~6 月,我们只做一件事: 把产品做到 可用、可卖、可规模化。
期间,有创投机构提出天使轮合作, 最终我们选择了婉拒。
不是排斥融资, 而是清楚地知道: 早期阶段,我们缺的不是钱, 而是对行业的理解、对产品的打磨,以及真实反馈。
开源,连接真实世界
作为技术团队,我们选择了开源作为切入口。
KnowFlow 在 GitHub 开源后, 逐步积累了 4000+ 粉丝和 1500+ 社群用户。
早期我们几乎和社区深度互动, 后期受限于精力,也不得不有所取舍, 但始终心怀感激。
有开发者无偿提供建议, 甚至提供服务器资源和商业化思路。
那种被信任的感觉,很难忘。
第一笔订单
第一笔订单金额并不大,只有 2000 元。
但那一刻, 我们第一次清晰地确认: 这件事是有价值的。
我至今记得团队成员当时的眼神, 那是一种"终于被现实验证"的感觉。
后来,一切开始慢慢滚动起来,正如武侠小说的主角光环。
截至目前,我们已服务 30+ 企业用户, 覆盖制造业、高校、研究院、国央企等多个领域。
总结与展望
2025 年,是 KnowFlow 的萌芽期。
挑战依然很多:
- Agentic RAG
- 端到端多模态
- 长上下文模型演进
- 市场、售前、售后能力建设
但换个角度看:
如果这些问题都已经被完美解决, 可能也就没有我们的机会了。
未来,KnowFlow 会持续深耕:
- 私有化知识库
- 工程化能力
- 多模态 RAG
并逐步联合硬件厂商、国产化生态, 提供更完整的一体化解决方案。
开源社区
可关注公众号 「KnowFlow 企业知识库」 获取最新动态、商务咨询与技术支持。