← 科学/03 AI工程引擎

SEMO 算法

只有AI才能驱动的N-of-1方案引擎

“人类专家做的是'经验猜测'。SEMO做的是'统计计算'。”

核心公式

SEMO(Selective Remodeling of Protein Networks by Chemicals)的核心是一个统计T检验框架。 对于每一个PPI子网络和每一种化合物,SEMO计算化合物靶点集合在网络中的分布显著性—— 不仅看靶基因,还要与同一网络中的非靶基因进行统计学比较。

SEMO 特征计算公式(专利 CN117766054A)

semo = (x̄ - ȳ) / √(s²x/n + s²y/m)

x̄: 靶点集合在网络中的平均邻近性

ȳ: 非靶点集合在网络中的平均邻近性

x, s²y: 各自的方差

n, m: 靶点和非靶点的数量

工程实现:为什么能一步到位?

01

预训练层

9,607个PPI子网络 × 2,658种化合物 → 百万级特征池

AI预先完成,一次训练永久可用

每个SEMO特征 = 化合物靶点集合在特定PPI子网络中的分布显著性(T检验)

02

个体化计算层

输入个体DNA甲基化数据 → 毫秒级计算每个SEMO特征值

AI实时计算

将个体的甲基化状态映射到PPI网络,计算每个化合物-网络组合的适配度评分

03

方案生成层

网络适配营养素Top排序 + 核心网络状态图谱 + 个体化干预建议

AI即时输出

根据适配度排序生成专属干预方案,覆盖营养、补剂、中药、药物等多种干预类型

临床验证:COVID-19双队列

SEMO算法在COVID-19研究中完成了首次临床验证。利用公开的DNA甲基化数据, SEMO准确预测了COVID-19严重程度,并在独立队列中验证了结果。

AUC(队列A)

0.81

COVID-19严重程度预测

AUC(队列B)

0.80

独立验证队列

核心枢纽

STAT1, MMP2

识别的关键蛋白质网络节点

推荐排名靠前

硫辛酸、维生素D3

与后续文献印证一致

知识产权保护

核心专利

CN117766054A — 基于预训练模型生成化合物干预方案的方法、系统及其应用

申请号:202310181767.8 | 申请日:2023.02.21

预印本论文

Utilizing Pre-trained Network Medicine Models for Generating Biomarkers, Targets, Re-purposing Drugs, and Personalized Therapeutic Regimes

bioRxiv 2023

专利组合

9项授权专利,覆盖算法核心、应用系统和数据产品