AlphaFold 3
/fs00/software/alphafold/3.0.0/AlphaFold-v3.0.0.sif
0. 基本信息
alphafold3是Google DeepMind开发的、用于生物分子复合体结构预测的人工智能模型,该模型接受一个json形式的、用于描述生物分子体系的文件,运行输出预测结构与置信度打分信息。结构预测过程主要分为两步:
- data pipeline: 在一定参数控制下,基于输入的序列信息进行生物信息学搜索,得到结构预测所需的共进化信息 (multi-sequence alginment, msa) 与结构模板 (templates),并将这些信息与输入信息整合,将整合信息作为json文件输出
- inference: 读取整合入msa和templates的json文件,转化为模型输入特征进行推理,输出mmcif格式的预测结构与confidence score
此处部署的是基于官方github库打包的apptainer容器。容器内包含alphafold3程序本体和依赖,不包含程序运行所需的数据库与预训练权重——这些需要在运行时以命令行参数传入。集群上部署有生信搜索所需数据库,模型权重的使用受term of use控制,请自行向Google DeepMind申请。
1. 使用方法
为避免冗长的路径和指令重复出现,定义变量
path_to_af3db="/bbfs/data/alphafold/3"
path_to_af3container="/fs00/software/alphafold/3.0.0/AlphaFold-v3.0.0.sif "
host_iopath=</path/to/your/input/and/output>
path_to_params=<path/to/directory/containing/your/af3-weights>
RUN_ALPHAFOLD="apptainer run --nv --bind \
${path_to_af3db}:/databases,${host_iopath}:/host_iopath \
${path_to_af3container} python run_alphafold.py"
本页面后续出现的指令均默认在有这些变量的环境下运行。其中${path_to_af3db}
是集群上alphafold3数据库地址,${host_iopath}
是默认输入输出
设输入文件为${host_iopath}
路径下的input.json
文件,输入文件,如下指令可使用alphafold3预测此文件描述体系的结构
${RUN_ALPHAFOLD} \
--db_dir=/databases/ \
--json_path=/host_iopath/input.json \
--output_dir=/host_iopath/ \
--model_dir=/host_iopath/params/