1 月 18 日下午,北京科技大学的一间报告厅里,十支大学生队伍依次登台,面对评委陈述他们的数据库系统设计。对于普通人来说宛如「天书」的架构图、性能曲线,以及选手和评委之间关于「查询优化方案」「RAG 可追溯性」的对答,持续了数个小时。
这是 2025 年全国大学生计算机系统能力大赛暨第五届 OceanBase 数据库大赛的决赛现场——本届赛事吸引全国高校的 1223 支队伍、2620 名学生参赛。该赛事自 2021 年发起,2023 年纳入全国大学生计算机系统能力大赛体系,为教育部认定的 A 类学科竞赛。五年来赛事累计覆盖 500 余所高校、超 1.1 万名学生,成为中国数据库领域核心人才培养的重要平台。

今年决赛,这群平均年龄只有 20 来岁的在校生,需要完成一个复杂课题:在单机 8 核 16GB 的资源限制下,从零构建一个能同时处理全文检索、标量过滤和向量相似度查询的数据库内核,并在此基础上搭建可溯源的多模态 RAG 系统。
事实上,这是一个颇具产业实践价值的课题。当前,大模型与 RAG 技术加速落地,企业 AI 应用对数据系统提出了全新要求:既要支持语义检索与结构化过滤等混合查询,也要满足权限控制、可追溯与一致性等治理要求,是决定 AI 系统能否精准响应、高效运行、稳定可信的关键。今年的赛题,不再只是考察 SQL 优化或事务处理这些数据库的基础操作,而是逼迫选手思考:当大模型需要实时、一致、可解释的数据支撑时,底层系统该如何重构?
经过两个多月比拼,北邮「编程高手」队凭借在数据库内核优化与 AI 应用开发中的综合表现,夺得冠军及 10 万元奖金。他们在赛后表示,备赛让他们更深刻体会到数据底座对 AI 应用的决定性作用,「我们不只是写代码,更在用系统思维验证 AI 应用的根基。如果数据库拖后腿,再强的模型也会卡壳。」

随着 RAG、智能客服、企业知识库等场景规模化落地,传统「数据库+搜索引擎」的拼接架构正暴露出延迟高、一致性差、治理困难等问题。行业共识正在形成:未来的 AI 原生应用,需要原生支持语义理解、结构化过滤与权限控制的一体化数据引擎支撑。数据库不再是沉默的后台组件,而成为决定 AI「答得准、跑得快、用得稳」的关键。
在颁奖典礼现场,学界与产业界专家形成了明确的共识:AI 正推动数据基础设施重构。数据库已从后台支撑走向前台核心,迎来前所未有的战略爆发期。相关人才缺口也将进一步扩大。
在 AI 时代,对工程师的要求正在从过去「会用工具」,向需要兼具「底层系统思维与 AI 工程化能力」的复合人才要求转变。这也解释了为何本届大赛特设「绿色通道」——获奖学生可直通 OceanBase 终面。过去四年,已有 160 余名参赛者加入该公司,其中 20 余人通过赛事通道入职。
当 00 后开始亲手构建 AI 时代的「数据地基」,中国 AI 基础设施的未来,或许就藏在这场安静却硬核的竞赛之中。