伯杰动态

我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用所有的cookie。如果您想详细的了解我们如何使用cookie,请访问我们的 隐私政策.

X说 | AI与诊断②,AI在引物探针设计中的应用,开启核酸检测新纪元

2025-02-27

图片

导语

在分子诊断领域中,引物和探针的设计是核酸检测和测序等方法的核心技术之一。传统设计方法依赖人工经验与反复试错,效率低、周期长且成本高昂,并且不具备设计方法本身的沉淀和持续进化能力。随着人工智能技术的突破,特别是近年来大模型的崛起,AI驱动的引物探针设计正成为行业革新的关键引擎,推动精准医疗与科研效率迈向新高度。

众所周知,理想的引物探针,特别是针对超多重病原体检测的引物探针组,应当具备扩增效率高,扩增均一性好,非特异扩增现象及引物二聚体少等特征,而这些特征依赖于靶序列本身的序列特征,如GC含量,基序,一级结构,二级结构等,引物探针的序列特征,包括GC含量,退火温度,引物长度等,以及靶序列的丰度,依靠经验很难发现潜在的有价值的序列特征。通过将千万级海量基因序列数据及其检测结果进行数据清洗和标注,并训练大语言模型,可快速锁定高扩增效率且丰度高的候选序列。我司搭建的序列分析大模型正在开发中,目前已初步筛选出若干高相关性的序列特征。

图片来源:网络


大模型的训练需要耗费相当大的计算资源,并且需要海量实验数据(企业通常难以提供),而针对确定的,数量可控,且区分度高的特征,传统机器学习算法则有数据需求量少,训练速度快,消耗资源少的优势,而针对引物探针设计,也同样存在着依赖人工经验,易返工等问题。在获得明确数量的特征后,可通过特征降维并将数千组湿试验数据制成数据集,用于训练混合模型并形成引物探针设计模型。目前,该模型正在开发中,初步测试结果显示,相对于人工设计,该模型能够将引物探针设计成功率提高50%,设计速度提高80%,从而真正实现降本增效。


传统引物探针设计通常基于美国国家生物信息中心(NCBI)提供的非冗余核酸数据库(NR)等公共数据库,这些数据库通常面临着数据量少,数据更新时效性差等问题,从而降低引物探针设计质量,容易造成试剂盒脱靶,漏检。而人工智能模型的自适应学习机制可以实时将最新的序列及其实验结果进行在训练,更新模型参数和数据库,在快速变异的病毒监测场景中,实时追踪新发突变,智能调整引物探针设计区域,从而避免脱靶和漏检问题。

从科研到临床,AI正重新定义引物探针设计的边界。我们致力于将复杂的生物信息学转化为简单易用的智能工具,让研究人员更专注于科学发现本身。通过持续迭代算法模型、整合多组学数据,我们期待与全球合作伙伴共同构建更高效、更智能的分子检测生态,为人类健康事业创造持久价值。


文字丨伯杰医学健康X研究院

编辑丨品牌宣传部

图片 | 来源于伯杰医疗

图片