“人类专家做的是'经验猜测'。SEMO做的是'统计计算'。”
核心公式
SEMO(Selective Remodeling of Protein Networks by Chemicals)的核心是一个统计T检验框架。 对于每一个PPI子网络和每一种化合物,SEMO计算化合物靶点集合在网络中的分布显著性—— 不仅看靶基因,还要与同一网络中的非靶基因进行统计学比较。
SEMO 特征计算公式(专利 CN117766054A)
x̄: 靶点集合在网络中的平均邻近性
ȳ: 非靶点集合在网络中的平均邻近性
s²x, s²y: 各自的方差
n, m: 靶点和非靶点的数量
工程实现:为什么能一步到位?
预训练层
9,607个PPI子网络 × 2,658种化合物 → 百万级特征池
AI预先完成,一次训练永久可用
每个SEMO特征 = 化合物靶点集合在特定PPI子网络中的分布显著性(T检验)
个体化计算层
输入个体DNA甲基化数据 → 毫秒级计算每个SEMO特征值
AI实时计算
将个体的甲基化状态映射到PPI网络,计算每个化合物-网络组合的适配度评分
方案生成层
网络适配营养素Top排序 + 核心网络状态图谱 + 个体化干预建议
AI即时输出
根据适配度排序生成专属干预方案,覆盖营养、补剂、中药、药物等多种干预类型
临床验证:COVID-19双队列
SEMO算法在COVID-19研究中完成了首次临床验证。利用公开的DNA甲基化数据, SEMO准确预测了COVID-19严重程度,并在独立队列中验证了结果。
AUC(队列A)
0.81
COVID-19严重程度预测
AUC(队列B)
0.80
独立验证队列
核心枢纽
STAT1, MMP2
识别的关键蛋白质网络节点
推荐排名靠前
硫辛酸、维生素D3
与后续文献印证一致
知识产权保护
核心专利
CN117766054A — 基于预训练模型生成化合物干预方案的方法、系统及其应用
申请号:202310181767.8 | 申请日:2023.02.21
预印本论文
Utilizing Pre-trained Network Medicine Models for Generating Biomarkers, Targets, Re-purposing Drugs, and Personalized Therapeutic Regimes
bioRxiv 2023
专利组合
9项授权专利,覆盖算法核心、应用系统和数据产品