具有自主知识产权的优质益生菌菌株,是企业核心竞争力所在。对酸奶等发酵乳制品而言,能否在产品中准确确认"自家菌株"的存在与比例,直接关系到产品质量溯源、功能声称的可信度,乃至菌株知识产权的有效保护。
然而,动物双歧杆菌乳亚种各菌株之间基因组高度保守——五株目标菌(J12、Bi-07、BB-12、HN019、B420)基因组约 1.94 Mb,GC 含量高度一致(约 60.49%)。16S rDNA 和 hsp60 基因测序只能鉴定到亚种层面,真正的菌株级鉴定依赖全基因组测序(WGS),但 WGS 需要 24–48 小时,成本是本研究方法的约 10 倍,难以满足工业快检需求。质谱法(LC-MS)虽展现出一定潜力,但样品前处理复杂,同样难以实现快速检测。
拉曼光谱无需染色、无需破碎细胞,直接捕获细胞内蛋白质、脂质、核酸、多糖等生物大分子的振动信息,形成每株细菌独一无二的"化学指纹"。研究聚焦 400–1800 cm⁻¹ 指纹区,采用星赛生物 FlowRACS HT300 系统,对 12 株益生菌(5 株同亚种目标菌 + 4 株其他双歧杆菌 + 3 株乳杆菌)进行单细胞光谱采集,每株菌收集 500–1000 条有效光谱,构建菌株化学指纹数据库。
Fig. 1 12株益生菌的单细胞拉曼光谱(SCRS):全谱(a)、指纹区特征(b-c)及 t-SNE 聚类分析(d)
研究对四个生长阶段分别建模,结果非常清晰:
延滞期:光谱重叠严重,J12 识别准确率仅 79%
对数期:细胞优先合成基础蛋白与核酸,菌株特异性代谢物有限,准确率升至 89%,J12 与 BB-12、HN019 仍难分辨
稳定期早期:生长放缓,菌株特异性次级代谢产物(胞外多糖、特征酶类等)大量积累,菌株间化学指纹差异被充分放大,J12 准确率跃升至 99.5%
稳定期晚期:仍维持 98% 以上
稳定期早期是细胞化学组成最具菌株特异性的阶段,也是本研究推荐的标准检测窗口。
Fig. 2 5株动物双歧杆菌乳亚种在4个生长阶段的单细胞拉曼光谱(SCRS)特征及 t-SNE 聚类分析。(a-b)延滞期;(c-d)对数期;(e-f)稳定期早期;(g-h)稳定期晚期
光谱数据经预处理后,依次采用三种算法:
t-SNE 降维可视化,验证 J12 在二维空间中独立聚类、边界清晰。值得注意的是,J12 与 Bi-07 存在局部重叠——这并非方法缺陷,而是二者共享 38 个同源基因簇、基因组亲缘关系最近的真实体现。
LDA 作为线性基线模型完成盲样验证,错分样本稀少且无系统性混淆。
SVM为核心分类模型。12 株菌整体准确率 0.939,F1 = 0.920;稳定期早期 J12 识别准确率超过 99.5%。
Fig. 3 基于 SVM 的跨层级细菌分类,并通过盲样预测进行验证,同时应用于动物双歧杆菌菌株识别。(a)不同细菌的 SVM 分类混淆矩阵;(b)不同细菌的 LDA 盲样预测结果;SVM 分类混淆矩阵,分别对应(c)延滞期、(d)对数期、(e)稳定期早期、(f)稳定期晚期
冻干菌粉的直接鉴定
不经任何额外培养,直接对四株乳亚种冻干粉上机检测,J12 准确率与召回率均达 0.999,其他菌株不低于 0.998,检测周期较传统方法缩短 80% 以上。
Fig. 4 冻干菌粉识别。4株冻干菌粉平均全波段拉曼光谱(a)、平均指纹区光谱(b)、t-SNE降维图(c)、精准率和召回率(d)
人工混合菌样的定量分析
构建液态混合(J12:HN019:Bi-07:B420:BB-12 = 6:1:1:1:1)与粉态混合(J12:HN019:Bi-07:B420 = 2:1:1:1)两类体系,预测值与理论值高度吻合:液态 MAE = 0.49%,R² = 0.9990;粉态 MAE = 0.41%,R² = 0.9989。不仅能定性鉴定,还能在多菌共存体系中定量。
Fig. 5 模型在人工混合样品中识别目标菌株 J12 的性能
商业酸奶中的 J12 溯源
依据国标 GB 4789.34-2016 从含 J12 的商业酸奶中分离纯化菌株,直接输入 SVM 模型预测,准确率与召回率均超过 99%,线下与云端拉曼 AI 平台结果完全一致,验证了方法的稳定性与可迁移性。
Fig. 6 商业酸奶中分离的动物双歧杆菌 J12 的识别。从酸奶中分离获得的细菌培养物的平均全波段拉曼光谱(a)、指纹区光谱(b);酸奶分离株与4株参考动物双歧杆菌(Bi-07、B420、BB12、HN019)单细胞拉曼光谱的离线本地 t-SNE 降维图(c)、基于云端 Raman AI 平台的 t-SNE 降维图(d);(e)SVM 模型对酸奶分离株及4株参考菌株进行分类时的混淆矩阵;(f)模型性能指标总结,包括准确率和召回率
研究对五株乳亚种进行全基因组测序与比较基因组分析,建立了一条清晰的遗传链条:
进化树显示,J12 独立成支,与 BB-12/HN019、B420/Bi-07 两个聚类均保持距离,具有独特演化地位。泛基因组分析表明,五株菌共享 1480 个核心基因(约 79.6%),J12 特有基因簇数量最多(35 个),远高于 B420(3 个)和 BB-12(4 个)。COG 功能注释显示,J12 在碳水化合物转运与代谢(COG G)的基因分布上与其他四株存在显著差异。
完整链条由此成立:J12 特有的碳水化合物代谢基因 → 独特的胞内多糖与代谢物组成 → 拉曼指纹区的特征散射峰,从基因层面解释了 SCRS-ML 方法的可靠性与稳定性。
Fig. 7 比较基因组学:5株动物双歧杆菌乳亚种的系统发育与功能分析。(a)基于核心基因构建的系统发育树;(b)基因组相关性热图;(c)COG 功能分类分布图;(d)展示5个样本同源基因分布的 Venn 图
在益生菌市场竞争日趋激烈的今天,如何从"喝了益生菌"走向"摄入了明确菌株、可量化功效",是整个行业需要跨越的关键一步。拉曼组技术凭借无标记、单细胞、无损、快速的独特优势,正在成为连接菌株基因型、代谢表型与健康功效的重要技术桥梁。
作为专注于单细胞功能表型解析与功能细胞分选装备研发的创新企业,星赛生物长期深耕单细胞拉曼光谱技术,以"看得见、测得准、分得开"为核心能力,持续为发酵食品质控、益生菌菌株鉴定、微生物代谢表型研究等前沿场景提供硬核工具支撑。



鲁公网安备37021202001515