生物信息学辞典 [复制链接]

帅哥

管理员

Rank: 9 Rank: 9 Rank: 9

电梯直达

1^#

发表于 2009-12-3 21:02:11 |只看该作者 |倒序浏览

生物信息学辞典

游客，如果您要查看本帖隐藏内容请回复

附件: 你需要登录才可以下载或查看附件。没有帐号？注册

分享0 收藏0

使用道具举报

帅哥

管理员

Rank: 9 Rank: 9 Rank: 9

2^#

发表于 2009-12-3 21:02:36 |只看该作者

生物信息学辞典
DNA微阵列或芯片(DNA
microarray or chip)技术
是近年发展起来的又一新的分子生物学研究工具，利用光导
化学合成、照相平板印刷以及固相表面化学合成等技术,在
固相表面合成成千上万个寡核苷酸探针，或将液相合成的探
针由微阵列器或机器人点样于尼龙膜或硅片上，再与放射性
同位素或荧光物标记的DNA或cDNA杂交,用于分析DNA突变
及多态性、DNA测序、监测同一组织细胞在不同状态下或同
一状态下多种组织细胞基因表达水平的差异、发现新的致病
基因或疾病相关基因等多个研究领域.
单核苷酸多态性(single
nucleotide
polymorphism，缩写
SNP)技术
由于同一位点的不同等位基因之间常常只有一个或几个核苷
酸的差异，因此在分子水平上对单个核苷酸的差异进行检测
是很有意义的。目前SNP作为一种新的分子标记，已有2000
多个标记定位于人类染色体上，在植物上也在进行开发研
究。可在胶上也可不在胶上就能检测出SNP，但检测SNP的
最佳方法是新近发展起来的DNA芯片技术。
特定序列位点
即sequence-tagged site,缩写STS，是对由其特定引物序列
所界定的一类标记的统称。这类分子标记包括：（1）STMS
(Sequence-tagged microsatellites)通常又称为SSR，也可称
为SSRP(Simple Sequence Repeat Polymorphisms)；（2）
加锚微卫星寡核苷酸(Anchored microsatellite
oligonucleotides)；（3）SCAR(Sequence-characterized
amplified regions)；（4）CAPS (Cleaved amplified
polymorphic sequence)；（5）SPAR (single primer
amplification reaction)；（6）DAMD(directed amplification
of minisatellite region DNA)；（7）Inter-Alu PCR like
genomic profiling；（8）ISTR(inverse sequence-tagged
repeat)；（9）IFLP (intron fragment length
polymorphism)；（10）RAMPO(random amplified
microsatellite polymorphism)
限制性片段长度多态性
即restriction fragment length polymorphism技术,缩写
RFLP，是发展最早的分子标记技术。RFLP技术的原理是检
测DNA在限制性内切酶酶切后形成的特定DNA片段的大小。
因此凡是可以引起酶切位点变异的突变如点突变(新产生和
去除酶切位点)和一段DNA的重新组织(如插入和缺失造成酶
切位点间的长度发生变化)等均可导致RFLP的产生。此技术
及其从中发展起来的一些变型均包括以下基本步骤：DNA的
提取、用限制性内切酶酶切DNA、用凝胶电泳分开DNA片
段、把DNA片段转移到滤膜上、利用放射性标记的探针显示
特定的DNA片段(通过Southern杂交)和分析结果。由于线粒
体和叶绿体DNA较小，前三个步骤就完全可能检测出DNA片
段的差异，所以往往不必要后面的几处步骤；对线粒体和叶
绿体DNA进行的这种多态性差异检测在1980年之前就已出
现，从理论上说，这种多态性也可称为RFLP。
分子标记
广义的分子标记(molecular marker)是指可遗传的并可检测
的DNA序列或蛋白质。其中，蛋白质标记包括种子贮藏蛋白
和同工酶(指由一个以上基因位点编码的酶的不同分子形式)
及等位酶(指由同一基因位点的不同等位基因编码的酶的不
同分子形式)。
狭义的分子标记概念只是指DNA标记。
序列模体搜索
该方法用于查找序列上的局部特征.一般的，在序列整体同
源性不明显的情况下，该方法可以提高功能预测的灵敏度，
该方法一般由以下两部分组成：（1）收集现有的蛋白质家
族，通过多重联配对蛋白质家族各成员的序列进行分析，构
造模体数据库；（2）利用序列对比等方法通过搜索该数据
库预测未知蛋白质的功能.典型的模体数据库有Prosite等.
比较基因组学
基因组的各组成基因在序列水平上有位置排列的顺序关系；
在转录、表达水平方面有基因、基因产物之间的相互作用.
因此完整地了解基因的功能必然要研究其在生物体代谢途径
中的地位，并尽可能揭示它们之间相互调控的机制，绘制出
调控网络的图式.比较基因组研究不仅可以揭示生命的起
源、进化等重大生物学问题，还具有不可低估的实用价值.
比如通过细菌、真核生物的比较基因组研究，有望筛选出只
在细菌中保守的基因，作为广谱抗菌素的药靶.目前该层次
的研究正处于起步阶段.
开放阅读框架（open
reading frame,ORF）的
识别手段
当前，其识别方式主要有两种：（1）概率型方法，即利用
数学概率方法评估未知DNA片段的编码可能性，例如应用隐
马尔可夫模型的GENSCAN；（2）通过同源性比较搜寻蛋白
质库或dbEST库找寻编码区，这是目前较为常用的方法，也
是比较可靠的一种预测手段。
COG（cluster of
orthologous group——
直系同源簇）方法
由Tatusov R L等提出，即用不同种族的基因成对相似聚类
法把它们划分成各种直系同源簇，从而可以用同一簇中的已
知基因注释未知基因的功能.该方法通过对未知基因进行基
因组水平上找寻直系同源体，从而借助相关直系同源体中已
知基因预测未知“开放阅读框架”的生物学功能。
DNA计算机
以核苷酸为内存，利用组合DNA技术来进行运算。这种形式
的“试管型”计算方式，在理论上可处理传统计算机的硅芯片
和电流难以处理的问题，因为它们是以“并行方式”进行计算
的，有一个具有4个位置（A、C、G、T）的内存，而一般计
算机的内存为两个位置（on/off），因而体积可以非常小。
Autosome
常染色体。与性别决定无关的染色体，人双倍体染色体组含
有46条染色体，其中22对常染色体，一对与性别决定有关的
性染色体（X和Y染色体）。
BLAST
Basic Local Alignment Search Tool，基本的基于局部对准的
搜索工具；一种快速查找与给定序列具有连续相同片断的序
列的技术。
Centimorgan
分摩，基因交换单位，简写为cM。是重组频率的一种度量
单位，1分摩等于在单代染色体交叉中，某遗传位点上的标
记具有1%的机会与另一个遗传位点上的标记相分离。对人
类来讲，1分摩平均等同于1Mb。
Centromere 着丝点。细胞分裂时纺锤丝所附着的染色体区域。
Chou-Fasman方法
基于单残基统计的关于蛋白质二级结构的经验预测方法。该
方法通过统计获得的单残基构象倾向性因子进行蛋白质二级
结构预测。
残基构象倾向性因子定义为：Pi=Ai/Ti（i=a，.，c，t），
其中下标i代表构象态；Ti是所有被统计残基处于第i种构象
态的分数；Ai代表第A种残基的对应分数；当Pi>1.0时，表
示该残基倾向于形成i种构象；当Pi<1.0时，表示该残基倾向
于形成其它构象。残基所处构象态最初采用Levitt&Greer的
判别方法，目前通用的二级结构指任方法则是
Kabsch&Sander的氢键模式识别方法。
Conserved sequence
保守序列。演化过程中基本上不变的DNA中的碱基序列或蛋
白质中的氨基酸序列。
由L. Holm, C. Sander在1998年提出的基于蛋白质结构对蛋
白质结构域进行结构分类的方法，即通过较大的、简洁的单
元，利用自动优化拓扑循环描述蛋白质结构域。成对的结构
关联定义一个抽象的折叠空间，利用本征向量投影在一个平
面来展示在该折叠空间的所有的折叠归属。相似的结构按照
折叠类型，或结构邻居在四种不同的半径下，进行系统分
群。对于序列和结构的保守图谱定义在折叠类或子类中心。
为了减少具有独特序列的蛋白质数目，折叠类型列于目录
中。
Dali结构域
Dali序列图 Dali二级结构 Dali结构域分布 Dali空间构象
Domain
功能域。蛋白质中具有某种特定功能的部分，它在序列上未
必是连续的。某蛋白质中所有功能域组合其起来决定着该蛋
白质的全部功能。
EBI
欧洲生物信息学研究所（European Bioinformatics
Institute）。
EMBL
欧洲分子生物学实验室（uropean Molecular Biology
Laboratory）。
EMBnet
欧洲分子生物学网络（ropean Molecular Biology
network）。
Entrez
美国国家生物技术信息中心所提供的在线资源检索器。该资
源将GenBank序列与其原始文献出处链接在一起。
EPD
真核启动子数据库（Eukaryotic Promoter Database）。是
由以色列Rehovot的Weizmann Institute of Science 设计和
发展起来的，现在则由瑞士Epalinges s/Lausanne的Swiss
Institute for Experimental Cancer Research维护，并得到瑞
士国家自然科学基金资助。EPD是EMBL核酸序列数据库的
注解库，专门收录EMBL核酸序列数据库中转录起始位点已
经由实验确定的真核POL II启动子的信息。
ExPASy（Expert
Protein Analysis
System）
蛋白质专家分析系统。由瑞士生物信息学研究所创办的蛋白
质组服务网站，提供蛋白质序列和结构相关的信息学服务，
包括蛋白质数据库（SWISS-PROT），蛋白质家族、功能位
点数据库（PROSITE），二维凝胶电泳数据库（SWISS-
2DPAGE），蛋白质及其他生物大分子的三维图像库
（SWISS-3DIMAGE）等著名蛋白质序列、结构数据库和
SWISS-MODEL等软件服务系统，提供蛋白质序列识别、表
征，核酸——〉蛋白质翻译，蛋白质及核酸的同源检索，模
式识别、蛋白质序列分析、蛋白质二级结构预测及三维构象
分析，跨膜区检测等多项服务，是目前较为全面的一个综合
服务站点。
Functional genomics
功能基因组学，是指对健康和疾病组织中基因活性的系统研
究。
GenBank 由美国国家生物技术信息中心提供的核酸序列数据库。
Gene
基因。遗传的基本的物理和功能单位。一个基因就是位于某
条染色体的某个位置上的核苷酸序列，其中蕴含着某种特定
功能产物（如蛋白质或RNA分子）的编码。
Gene expression
基因表达。基因中的编码信息被转换成行使特定功能的结构
产物的过程。
Gene family 基因家族。一组密切相关的编码相似产物的基因。
Gene mapping
基因作图。对DNA分子（染色体或质粒）中基因的相对位置
和距离进行确定的过程。
Genetic code
遗传密码。以三联体密码子的形式编码于mRNA中的核苷酸
序列，决定着所合成蛋白质中的氨基酸序列。
Genome
基因组。某一物种的一套完整染色体组中的所有遗传物质。
其大小一般以其碱基对总数表示。
Genomics
基因组学。从事基因组的序列测定和表征描述，以及基因活
性与细胞功能关系的研究。
HGMP
英国剑桥的人类基因组绘图计划（Human Genome Mapping
Project）。
HSSP
基于蛋白质结构、序列对比中的结构内涵的蛋白质同源数据
库，称为源于蛋白质二级结构的同源数据库（database of
Homology-derived Secondary Structure of Proteins）。
INCBI 爱尔兰国家生物信息学中心。
Informatics
信息学。研究计算机和统计学技术在信息处理中的应用的学
科。在基因组计划中，信息学的内容包括快速搜索数据库方
法的开发、DNA序列信息分析方法的开发和从DNA序列数据
中预测蛋白质序列和结构方法的开发。
Marker
标记。染色体上可识别的可以监测其遗传情况的物理位置
（如限制性酶切位点和基因等）。标记可以是DNA中的表达
区（如基因），也可以是目前不知道其编码功能的但其遗传
情况可以得到确定的DNA片断。
Multifactorial or
multigenic disorder
多基因病。参见Polygenic disorder。
NCBI
美国国立生物技术信息中心（National Center for
Biotechnology Information），1988年设立，为美国国家医
学图书馆（NLM）和国家健康协会（NIH）下属部门之一。
提供生物医学领域的信息学服务，如世界三大核酸数据库之
一的GenBank数据库，PubMed医学文献检索数据库等。
PHYLIP
J. Felsenstein 开发的一个被广泛应用于系统发生学研究的
程序包。
物理图谱。不考虑遗传，DNA中可识别的界标（如限制性酶
切位点和基因等）的位置图。界标之间的距离用碱基对度
Physical map
量。对人类基因组而言，最低分辨率的物理图谱是染色体上
的条带图谱；最高分辨率的物理图谱是染色体中完整的核苷
酸序列。
PIR
Protein Identification Resource International, a protein
database vendor.
Polygenic disorder
多基因病。由多于一个基因的等位基因共同导致的遗传疾病
（如心脏病、糖尿病和某些癌症）。
Polymorphism 多态现象。DNA序列中的个体差异。
Promoter 启动子。DNA中被RNA聚合酶结合并从此起始转录的位点。
Proteome 蛋白质组。一个基因组的全部蛋白产物及其表达情况。
Ramachandran图
虽然从理论上讲，蛋白质主链酰胺键作为单键，能够自由旋
转（绕二面角f 、? ），但是空间位阻的存在使得f 、? 的取
值局限于某一区域。对于已知晶体结构的蛋白质结构数据的
统计分析表明主链的二面角f 、? 存在明显的取值范围，这
种通过主链二面角f 、? 确定蛋白质分布区域的图形称为
Ramachandran图。
Regulatory region or
sequence
调控区或调控序列。控制基因表达的DNA碱基序列。
Ribosomal RNA
核糖体RNA。简写为rRNA。是一组存在于核糖体中的RNA分
子。
Sequence tagged site
序列示踪位点，简写为STS。在人类基因组中只出现一次的
位置和序列已知的长约200到500bp的短DNA序列片断。由
于可以通过PCR检测到，STS在将来源于许多不同实验室的
基因图谱和测序数据进行定位和定向时非常有用，并且STS
在人类基因组的物理图谱中也具有界标的作用。表达的序列
标签（ESTs）就是那些得自cDNAs的STSs。
Sequencing
测序。确定DNA或RNA分子中核苷酸序列，或者是确定蛋白
质中氨基酸序列的过程。
Single-gene disorder
单基因病。由单个基因的等位基因的突变所导致的遗传病
（如杜兴肌营养不良和成视网膜细胞瘤等）。
Somatic cell
体细胞。生物体中除了配子细胞及其前体细胞之外的所有细
胞。
SRS
T. Etzold 开发的生物学数据库浏览系统。
Tandem repeat
sequences
串联重复序列。染色体上同一碱基序列的多拷贝重复，在物
理作图中用作标记物。
Telomere
端粒。染色体的末端结构，与线性DNA分子的复制和稳定性
有关。
UniGene
美国国家生物技术信息中心提供的公用数据库，该数据库将
GenBank中属于同一条基因的所有片断拼接成完整的基因进
行收录。
a—螺旋结构
又称3.613螺旋，，多肽链主链螺旋结构中最常见类型，具
有如下特征：
1. 每圈包含3.6个残基，螺距0.54nm，残基高度
0.15nm，螺旋半径0.23nm；
2. 相邻螺旋间形成键内氢键
3. 每个f 角等于-57°，每个? 角等于-47°。
关于蛋白质分子结构中“非极性（疏水）残基存在于蛋白质
氨基酸构象
分子的内部，极性（亲水）残基大多存在于蛋白质分子的表
面”的规则描述，体现氨基酸性质、构象的划分。研究结果
表明，不同的氨基酸残基对蛋白质的折叠和三维结构具有明
显不同的效应。
1. 甘氨酸（Gly）唯一具有对称主链碳原子、最小残基。
柔性大，体积小，常出现在需要运动和转折的肽链片
断中；
2. 脯氨酸（Pro）具有最强的立体化学效应，常常形成转
角而改变主链的方向；环的空阻障碍将破坏规则二级
结构如a螺旋、.折叠。在蛋白质分子中，经常出现在
转角中且常暴露在蛋白质分子表面，位于亲水侧链的
位置；
3. 半胱氨酸（Cys）具有结合Fe、Fe-S及其它非蛋白质基
团以及能够形成二硫键；具有三种存在类型：自由
的—SH基团、配位的—SH基团、二硫键；常埋藏于分
子内部，提高稳定性；
4. 丙氨酸（Ala）可以出现在任何位置，最没有个性的氨
基酸；
5. 带有脂肪侧链的疏水氨基酸—缬氨酸（Val）、异亮氨
酸（Ile）、亮氨酸（Leu）、蛋氨酸（Met）形成疏水
中心，处于蛋白质内部，常出现在.结构中；
6. 丝氨酸（Ser）能够被磷酸化，成为接糖位点，具有较
强的化学活性，常作为活性部位残基；
7. 苏氨酸（Thr）易于形成分子内、分子间氢键；常出现
在.结构中；
8. 天冬酰胺（Asn）方向唯一，常出现在转角1、3位；
位于a螺旋开端，允许主链拐向另一方向；大量的研究
结果表明，作为螺旋起点或糖结合点的Asn，Ser是其
最保守替换；在转角1、3位置时，Asp是其最保守替
换；在左手螺旋结构中，Gly是其保守替换；
9. 谷酰胺（Gln）一般不与Asn替换，不出现在左手螺旋
中，只能形成一般氢键；
10. 天冬氨酸（Asp）、谷氨酸（Glu）—酸性氨基酸，出
现在螺旋的第一圈，与螺旋的偶极发生作用；处于蛋
白质外部，形成盐桥；常作为钙离子结合点；
11. 赖氨酸（Lys）、精氨酸（Arg）—碱性氨基酸，位于
螺旋最后一圈，处于蛋白外部，成为活性部位—Lys起
结合作用，Arg常参与催化；Lys侧链柔性大，稳定蛋
白质结构；Arg较Lys疏水性强，常常侧链弯曲形成疏
水平面保守性替代Ile，Arg与Lys常不能进行保守替
换；
12. 组氨酸（His）唯一PH值接近中性的氨基酸，在周围环
境发生微小变化即可使其获得或失去电荷，常作为活
性位置残基；
13. 芳香性氨基酸—苯丙氨酸（Phe）、酪氨酸（Tyr）、
色氨酸（Trp），形成蛋白质内部疏水核心的的主要残
基，均包含共轭p电子体系，是最佳电子给体；在一些
氧化—还原酶的辅基相互作用、与核酸碱基键形成的
配合物激发态的电荷转移相互作用中，色氨酸起着重
要作用。
表观静电势
在探讨酶与底物的特异性结合、膜通道开关、蛋白质分子间
相互作用等有关蛋白质结构功能关系，以及在蛋白质折叠、
分子动力学模拟、分子设计等理论研究中，表观静电势的模
型、方法的建立扮演着举足轻重的角色。目前，用于分析蛋
白质表观静电势的理论方法、模型主要包括：[1]微观模
型：Warshel等基于Monte-Carlo及动力学模拟提出的处理手
段，采用电荷分布、原子极化、溶剂游离表征体系的导电性
质；[2]宏观模型：利用经典静电方程和电化学中的离子氛
理论引入介电常数进行处理。考虑到微观模型的限制，当前
采用的多是建立在Debye-Huckel理论上的腔介质宏观模型。
蛋白质结构
蛋白质结构分为6个级别：一级结构、二级结构、超二级结
构、结构域、三级结构、四级结构。一级结构意味着蛋白质
的序列；二级结构为蛋白质中多肽主链的规则分布（如a螺
旋、.折叠等），即肽链借助于氢键沿一维方向排列成具有
周期性的结构构象；超二级结构代表二级结构单元间的组合
方式（如all-a、all-.、a+.等），即相邻的二级结构单元相
互组合，彼此作用，形成排列规则且在空间结构上能够辨认
的二级结构组合体，并充当散剂结构的构件（Block
Building），超二级结构是介于二级结构与结构域之间的结
构层次；结构域是蛋白质折叠中的一个层次结构，在超二级
结构的基础上，蛋白质进一步盘绕折叠形成紧密的近乎球状
的结构；三级结构代表蛋白质的三维空间构象；四级结构则
是指蛋白质亚基间通过疏水作用结合成的有序排列的特定空
间构象。
蛋白质三级结构的折叠类
型
根据每个结构域中二级结构单元的类型、数量、组合，主链
骨架的各层相对于疏水核心的数目和形状，以及在一层中肽
链之间连接的拓扑图等，将结构域的三级结构分为以下四种
主要类型：
1. 全a：顾名思义，三级结构全部由a—螺旋组成。该类
型中最简单的亚类是升降螺旋捆（up-and-down helix
bundle），即相邻的a—螺旋反向排列，头尾相接，形
成类似筒状的螺旋捆或螺旋簇；另一个亚类是所谓的
希腊花边螺旋捆（Greek Key Helix Bundle）；
2. 平行a/.：由a—螺旋和.-折叠沿着肽链方向交替存
在，折叠组成多层结构。平行的.—折叠片层在内部，
a—螺旋形成外部覆盖区；
3. 反平行.结构：最常见的亚类是所谓的“希腊花边.
筒”（Greek Key .—barrel）
4. 不规则结构。
蛋白质主链二面角
蛋白质主链中包含三类二面角：f （二面角C—N—Ca
—
C）、? （二面角N—Ca
—C—N）、? （二面角Ca
—C—N —C
a）。主链二面角取值范围：-180°~180°。
基于准各态历经假设下，通过任何力学量对系综的平均等于
该力学量对时间的平均，而力学量对时间的平均可以通过经
典运动方程所决定的运动轨迹获得。通俗的说，分子动力学
动态模拟即是在经典牛顿力学的基础理论上，给定分子势函
分子动力学动态模拟
数、力场，通过求解牛顿方程动态研究分子的运动与构象空
间。1977年哈佛大学M. Karplus首次将该方法应用于蛋白质
研究。
分子对接
在探讨蛋白质分子间相互作用（如酶与底物、受体与配基、
膜通道开关等）、药物与受体间的相互作用时，分子对接方
法（DOCK）是理论预测相互作用的必不可少的模型。分子
对接方法基于作用物的空间互补、静电匹配的原则，在假定
作用前后单体空间构象不发生变化的情况下，通过直观探讨
作用结合部位的作用能量（包括分子间氢键、色散力、静电
作用等）、作用构象确定最佳作用取向，进而研究分子间的
相互作用。
分子力学优化
通过对分子能量的计算、构象调整，在一定的经典力场下，
在分子势能面上寻找低能量构象。分子力学优化起始于能量
的初函数，趋向势能面低能量的方向、距离，通过能量对距
离的一阶偏微分达到收敛。常用的分子力学优化方法包括：
最陡下降法、共轭梯度法、牛顿—拉普森方法。
计算机辅助药物设计
新兴边缘科学。以计算机为辅助工具，根据分子生物学实验
积累的相关生物活性物质结构与功能的材料，以及药物在体
内作用“靶点”即所谓受体的三维结构知识，设计具有特定
疗效的药物分子，通过有机合成、药理测试，进而获得高
效、低毒且具有较好生物利用度的分子，进入新药研究的下
一个阶段。计算机辅助药物设计可以大大加快新药发现的速
度，提高新药的开发效率，节省大量的人力、物力、财力。
计算机辅助药物设计包括以下四种途径：
1. 探索系列小分子药物空间构象于生物学功能关系，获
得QSAR模型或药效基团模型，对现有化合物进行结构
改造或进行全新药物设计（de novo）；
2. 根据已知药物结构预测受体结构模型，结合预测的模
型进行药物设计；
3. 在受体生物分子空间构象已经阐明的情况下，搜索药
物分子数据库（MDL数据库，剑桥小分子数据库），
通过几何形状、化学结构、表观静电分布等获得、设
计与受体活性部位相互匹配的化合物；
4. 利用组合化学的方法，在定量构效关系、受体结构要
求、分子量等约束条件下，建立化学反应产物数据
库，然后根据分子的差异性等条件挑选合适的化合物
进行合成、测试，最终获得具有前途的化合物。
量子化学从头计算（ab
initio）
基于量子力学微观理论，在非相对论近似、核冻结近似
（Born-Oppenheimer近似）、轨道近似（单电子近似）的
基础上，通过将分子轨道表示成原子轨道的线性组合，利用
自洽场方法求解Hartree-Fock-Roothann方程，获得体系波
函数，进而从微观角度进行性质研究。
当前涉及从头算方法的软件包括：
? Gaussian程序（Gaussian92、Gaussian94、
Gaussian98等）
? Turbermol程序
? Dmol程序
? SPARTAN程序等
双重序列对比
两序列间的对比分析。最常见的方法为Needle-Wunsch方
法。能够利用的软件如BLAST、FASTA等。
顾名思义，即基于目标序列的同源结构预测目标结构。一般
地，同源模建的步骤如下：
1. 从蛋白质晶体结构数据库（PDB）中搜索同源参考蛋
白
2. 从同源蛋白的结构信息确定结构保守区（Structural
同源模建
Conservative Region）
3. 依据确定的结构保守区确定目标序列的结构保守区
4. 对目标序列结构保守区构建主链
5. 利用同源结构或构象搜索方法构建目标序列的可变区
6. 由以上求得的目标蛋白的主链碳原子坐标寻求其它
轻、重原子的坐标，完成侧链安装
7. N、C端结构修饰
8. 二硫键的形成
9. 结构优化、评估
由L-氨基酸组成的多肽链
的基本构象
规则构象f ? ? 螺距
每螺距的
残基数
完全伸展的链+180 +180 +180 0.73 2.00
右手a—螺旋-57 -47 +180 0.54 3.62
左手a—螺旋+57 +47 +180 0.54 3.62
3.010—螺旋-49 -26 +180 0.60 3.00
p—螺旋-57 -70 +180 0.51 4.40
平行.—结构-119 +113 +180 0.65 2.00
反平行.—结
构-139 +135 -178 0.70 2.00
有机分子、生物大分子体
系常用力场
力场应用范围
MM2/MM3 有机分子
Amber 生物分子
CHARMM 生物分子
Tripos 有机分子、生物大分子
YETI 包含金属的生物分子
Universal
所有类型的小分子（主族元素化合物、有机
分子、金属配合物）
Dreiding 主族元素组成的有机小分子、无机小分子
GROMOS 生物大分子
POLARIS 生物大分子
非蛋白质编码区
非蛋白质编码区（“Junk”DNA）占据了人类基因组的大部
分，研究表明“Junk”是许多对生命过程富有活力的不同类
型的DNA的复合体，它们至少包括以下类型的DNA成份或由
其表达的RNA成分：内含子（intron）、卫星（Satellite）
DNA、小卫星（minisatellite）DNA、微卫星
（microsatellite）DNA、非均一核RNA（hmRNA）、短散置
元（short interspersed elements）、长散置元（long
interspersed elements）、伪基因（pseudogenes）等。除
此之外，顺式调控元件，如启动子、增强子等也属于非编码
序列。

使用道具举报

返回列表

帐号		自动登录	找回密码
密码			注册