← 科学/03 AI工程引擎

SEMO 算法

只有AI才能驱动的N-of-1方案引擎

“人类专家做的是'经验猜测'。SEMO做的是'统计计算'。”

核心公式

SEMO（Selective Remodeling of Protein Networks by Chemicals）的核心是一个统计T检验框架。对于每一个PPI子网络和每一种化合物，SEMO计算化合物靶点集合在网络中的分布显著性—— 不仅看靶基因，还要与同一网络中的非靶基因进行统计学比较。

SEMO 特征计算公式（专利 CN117766054A）

semo = (x̄ - ȳ) / √(s²_x/n + s²_y/m)

x̄: 靶点集合在网络中的平均邻近性

ȳ: 非靶点集合在网络中的平均邻近性

s²_x, s²_y: 各自的方差

n, m: 靶点和非靶点的数量

9,607个PPI子网络 × 2,658种化合物 → 百万级特征池

AI预先完成，一次训练永久可用

每个SEMO特征 = 化合物靶点集合在特定PPI子网络中的分布显著性（T检验）

输入个体DNA甲基化数据 → 毫秒级计算每个SEMO特征值

AI实时计算

将个体的甲基化状态映射到PPI网络，计算每个化合物-网络组合的适配度评分

网络适配营养素Top排序 + 核心网络状态图谱 + 个体化干预建议

AI即时输出

根据适配度排序生成专属干预方案，覆盖营养、补剂、中药、药物等多种干预类型

SEMO算法在COVID-19研究中完成了首次临床验证。利用公开的DNA甲基化数据， SEMO准确预测了COVID-19严重程度，并在独立队列中验证了结果。

AUC（队列A）

0.81

COVID-19严重程度预测

AUC（队列B）

0.80

独立验证队列

核心枢纽

STAT1, MMP2

识别的关键蛋白质网络节点

推荐排名靠前

硫辛酸、维生素D3

与后续文献印证一致

核心专利

CN117766054A — 基于预训练模型生成化合物干预方案的方法、系统及其应用

申请号：202310181767.8 | 申请日：2023.02.21

预印本论文

Utilizing Pre-trained Network Medicine Models for Generating Biomarkers, Targets, Re-purposing Drugs, and Personalized Therapeutic Regimes

bioRxiv 2023

专利组合

9项授权专利，覆盖算法核心、应用系统和数据产品