生物信息学辞典
<P>生物信息学辞典</P>**** Hidden Message *****<P> </P> 生物信息学辞典<BR>DNA微阵列或芯片(DNA<BR>microarray or chip)技术<BR>是近年发展起来的又一新的分子生物学研究工具,利用光导<BR>化学合成、照相平板印刷以及固相表面化学合成等技术,在<BR>固相表面合成成千上万个寡核苷酸探针,或将液相合成的探<BR>针由微阵列器或机器人点样于尼龙膜或硅片上,再与放射性<BR>同位素或荧光物标记的DNA或cDNA杂交,用于分析DNA突变<BR>及多态性、DNA测序、监测同一组织细胞在不同状态下或同<BR>一状态下多种组织细胞基因表达水平的差异、发现新的致病<BR>基因或疾病相关基因等多个研究领域.<BR>单核苷酸多态性(single<BR>nucleotide<BR>polymorphism,缩写<BR>SNP)技术<BR>由于同一位点的不同等位基因之间常常只有一个或几个核苷<BR>酸的差异,因此在分子水平上对单个核苷酸的差异进行检测<BR>是很有意义的。目前SNP作为一种新的分子标记,已有2000<BR>多个标记定位于人类染色体上,在植物上也在进行开发研<BR>究。可在胶上也可不在胶上就能检测出SNP,但检测SNP的<BR>最佳方法是新近发展起来的DNA芯片技术。<BR>特定序列位点<BR>即sequence-tagged site,缩写STS,是对由其特定引物序列<BR>所界定的一类标记的统称。这类分子标记包括:(1)STMS<BR>(Sequence-tagged microsatellites)通常又称为SSR,也可称<BR>为SSRP(Simple Sequence Repeat Polymorphisms);(2)<BR>加锚微卫星寡核苷酸(Anchored microsatellite<BR>oligonucleotides);(3)SCAR(Sequence-characterized<BR>amplified regions);(4)CAPS (Cleaved amplified<BR>polymorphic sequence);(5)SPAR (single primer<BR>amplification reaction);(6)DAMD(directed amplification<BR>of minisatellite region DNA);(7)Inter-Alu PCR like<BR>genomic profiling;(8)ISTR(inverse sequence-tagged<BR>repeat);(9)IFLP (intron fragment length<BR>polymorphism);(10)RAMPO(random amplified<BR>microsatellite polymorphism)<BR>限制性片段长度多态性<BR>即restriction fragment length polymorphism技术,缩写<BR>RFLP,是发展最早的分子标记技术。RFLP技术的原理是检<BR>测DNA在限制性内切酶酶切后形成的特定DNA片段的大小。<BR>因此凡是可以引起酶切位点变异的突变如点突变(新产生和<BR>去除酶切位点)和一段DNA的重新组织(如插入和缺失造成酶<BR>切位点间的长度发生变化)等均可导致RFLP的产生。此技术<BR>及其从中发展起来的一些变型均包括以下基本步骤:DNA的<BR>提取、用限制性内切酶酶切DNA、用凝胶电泳分开DNA片<BR>段、把DNA片段转移到滤膜上、利用放射性标记的探针显示<BR>特定的DNA片段(通过Southern杂交)和分析结果。由于线粒<BR>体和叶绿体DNA较小,前三个步骤就完全可能检测出DNA片<BR>段的差异,所以往往不必要后面的几处步骤;对线粒体和叶<BR>绿体DNA进行的这种多态性差异检测在1980年之前就已出<BR>现,从理论上说,这种多态性也可称为RFLP。<BR>分子标记<BR>广义的分子标记(molecular marker)是指可遗传的并可检测<BR>的DNA序列或蛋白质。其中,蛋白质标记包括种子贮藏蛋白<BR>和同工酶(指由一个以上基因位点编码的酶的不同分子形式)<BR>及等位酶(指由同一基因位点的不同等位基因编码的酶的不<BR>同分子形式)。<BR>狭义的分子标记概念只是指DNA标记。<BR>序列模体搜索<BR>该方法用于查找序列上的局部特征.一般的,在序列整体同<BR>源性不明显的情况下,该方法可以提高功能预测的灵敏度,<BR>该方法一般由以下两部分组成:(1)收集现有的蛋白质家<BR>族,通过多重联配对蛋白质家族各成员的序列进行分析,构<BR>造模体数据库;(2)利用序列对比等方法通过搜索该数据<BR>库预测未知蛋白质的功能.典型的模体数据库有Prosite等.<BR>比较基因组学<BR>基因组的各组成基因在序列水平上有位置排列的顺序关系;<BR>在转录、表达水平方面有基因、基因产物之间的相互作用.<BR>因此完整地了解基因的功能必然要研究其在生物体代谢途径<BR>中的地位,并尽可能揭示它们之间相互调控的机制,绘制出<BR>调控网络的图式.比较基因组研究不仅可以揭示生命的起<BR>源、进化等重大生物学问题,还具有不可低估的实用价值.<BR>比如通过细菌、真核生物的比较基因组研究,有望筛选出只<BR>在细菌中保守的基因,作为广谱抗菌素的药靶.目前该层次<BR>的研究正处于起步阶段.<BR>开放阅读框架(open<BR>reading frame,ORF)的<BR>识别手段<BR>当前,其识别方式主要有两种:(1)概率型方法,即利用<BR>数学概率方法评估未知DNA片段的编码可能性,例如应用隐<BR>马尔可夫模型的GENSCAN;(2)通过同源性比较搜寻蛋白<BR>质库或dbEST库找寻编码区,这是目前较为常用的方法,也<BR>是比较可靠的一种预测手段。<BR>COG(cluster of<BR>orthologous group——<BR>直系同源簇)方法<BR>由Tatusov R L等提出,即用不同种族的基因成对相似聚类<BR>法把它们划分成各种直系同源簇,从而可以用同一簇中的已<BR>知基因注释未知基因的功能.该方法通过对未知基因进行基<BR>因组水平上找寻直系同源体,从而借助相关直系同源体中已<BR>知基因预测未知“开放阅读框架”的生物学功能。<BR>DNA计算机<BR>以核苷酸为内存,利用组合DNA技术来进行运算。这种形式<BR>的“试管型”计算方式,在理论上可处理传统计算机的硅芯片<BR>和电流难以处理的问题,因为它们是以“并行方式”进行计算<BR>的,有一个具有4个位置(A、C、G、T)的内存,而一般计<BR>算机的内存为两个位置(on/off),因而体积可以非常小。<BR>Autosome<BR>常染色体。与性别决定无关的染色体,人双倍体染色体组含<BR>有46条染色体,其中22对常染色体,一对与性别决定有关的<BR>性染色体(X和Y染色体)。<BR>BLAST<BR>Basic Local Alignment Search Tool,基本的基于局部对准的<BR>搜索工具;一种快速查找与给定序列具有连续相同片断的序<BR>列的技术。<BR>Centimorgan<BR>分摩,基因交换单位,简写为cM。是重组频率的一种度量<BR>单位,1分摩等于在单代染色体交叉中,某遗传位点上的标<BR>记具有1%的机会与另一个遗传位点上的标记相分离。对人<BR>类来讲,1分摩平均等同于1Mb。<BR>Centromere 着丝点。细胞分裂时纺锤丝所附着的染色体区域。<BR>Chou-Fasman方法<BR>基于单残基统计的关于蛋白质二级结构的经验预测方法。该<BR>方法通过统计获得的单残基构象倾向性因子进行蛋白质二级<BR>结构预测。<BR>残基构象倾向性因子定义为:Pi=Ai/Ti(i=a,.,c,t),<BR>其中下标i代表构象态;Ti是所有被统计残基处于第i种构象<BR>态的分数;Ai代表第A种残基的对应分数;当Pi>1.0时,表<BR>示该残基倾向于形成i种构象;当Pi<1.0时,表示该残基倾向<BR>于形成其它构象。残基所处构象态最初采用Levitt&Greer的<BR>判别方法,目前通用的二级结构指任方法则是<BR>Kabsch&Sander的氢键模式识别方法。<BR>Conserved sequence<BR>保守序列。演化过程中基本上不变的DNA中的碱基序列或蛋<BR>白质中的氨基酸序列。<BR>由L. Holm, C. Sander在1998年提出的基于蛋白质结构对蛋<BR>白质结构域进行结构分类的方法,即通过较大的、简洁的单<BR>元,利用自动优化拓扑循环描述蛋白质结构域。成对的结构<BR>关联定义一个抽象的折叠空间,利用本征向量投影在一个平<BR>面来展示在该折叠空间的所有的折叠归属。相似的结构按照<BR>折叠类型,或结构邻居在四种不同的半径下,进行系统分<BR>群。对于序列和结构的保守图谱定义在折叠类或子类中心。<BR>为了减少具有独特序列的蛋白质数目,折叠类型列于目录<BR>中。<BR>Dali结构域<BR>Dali序列图 Dali二级结构 Dali结构域分布 Dali空间构象<BR>Domain<BR>功能域。蛋白质中具有某种特定功能的部分,它在序列上未<BR>必是连续的。某蛋白质中所有功能域组合其起来决定着该蛋<BR>白质的全部功能。<BR>EBI<BR>欧洲生物信息学研究所(European Bioinformatics<BR>Institute)。<BR>EMBL<BR>欧洲分子生物学实验室(uropean Molecular Biology<BR>Laboratory)。<BR>EMBnet<BR>欧洲分子生物学网络(ropean Molecular Biology<BR>network)。<BR>Entrez<BR>美国国家生物技术信息中心所提供的在线资源检索器。该资<BR>源将GenBank序列与其原始文献出处链接在一起。<BR>EPD<BR>真核启动子数据库(Eukaryotic Promoter Database)。是<BR>由以色列Rehovot的Weizmann Institute of Science 设计和<BR>发展起来的,现在则由瑞士Epalinges s/Lausanne的Swiss<BR>Institute for Experimental Cancer Research维护,并得到瑞<BR>士国家自然科学基金资助。EPD是EMBL核酸序列数据库的<BR>注解库,专门收录EMBL核酸序列数据库中转录起始位点已<BR>经由实验确定的真核POL II启动子的信息。<BR>ExPASy(Expert<BR>Protein Analysis<BR>System)<BR>蛋白质专家分析系统。由瑞士生物信息学研究所创办的蛋白<BR>质组服务网站,提供蛋白质序列和结构相关的信息学服务,<BR>包括蛋白质数据库(SWISS-PROT),蛋白质家族、功能位<BR>点数据库(PROSITE),二维凝胶电泳数据库(SWISS-<BR>2DPAGE),蛋白质及其他生物大分子的三维图像库<BR>(SWISS-3DIMAGE)等著名蛋白质序列、结构数据库和<BR>SWISS-MODEL等软件服务系统,提供蛋白质序列识别、表<BR>征,核酸——〉蛋白质翻译,蛋白质及核酸的同源检索,模<BR>式识别、蛋白质序列分析、蛋白质二级结构预测及三维构象<BR>分析,跨膜区检测等多项服务,是目前较为全面的一个综合<BR>服务站点。<BR>Functional genomics<BR>功能基因组学,是指对健康和疾病组织中基因活性的系统研<BR>究。<BR>GenBank 由美国国家生物技术信息中心提供的核酸序列数据库。<BR>Gene<BR>基因。遗传的基本的物理和功能单位。一个基因就是位于某<BR>条染色体的某个位置上的核苷酸序列,其中蕴含着某种特定<BR>功能产物(如蛋白质或RNA分子)的编码。<BR>Gene expression<BR>基因表达。基因中的编码信息被转换成行使特定功能的结构<BR>产物的过程。<BR>Gene family 基因家族。一组密切相关的编码相似产物的基因。<BR>Gene mapping<BR>基因作图。对DNA分子(染色体或质粒)中基因的相对位置<BR>和距离进行确定的过程。<BR>Genetic code<BR>遗传密码。以三联体密码子的形式编码于mRNA中的核苷酸<BR>序列,决定着所合成蛋白质中的氨基酸序列。<BR>Genome<BR>基因组。某一物种的一套完整染色体组中的所有遗传物质。<BR>其大小一般以其碱基对总数表示。<BR>Genomics<BR>基因组学。从事基因组的序列测定和表征描述,以及基因活<BR>性与细胞功能关系的研究。<BR>HGMP<BR>英国剑桥的人类基因组绘图计划(Human Genome Mapping<BR>Project)。<BR>HSSP<BR>基于蛋白质结构、序列对比中的结构内涵的蛋白质同源数据<BR>库,称为源于蛋白质二级结构的同源数据库(database of<BR>Homology-derived Secondary Structure of Proteins)。<BR>INCBI 爱尔兰国家生物信息学中心。<BR>Informatics<BR>信息学。研究计算机和统计学技术在信息处理中的应用的学<BR>科。在基因组计划中,信息学的内容包括快速搜索数据库方<BR>法的开发、DNA序列信息分析方法的开发和从DNA序列数据<BR>中预测蛋白质序列和结构方法的开发。<BR>Marker<BR>标记。染色体上可识别的可以监测其遗传情况的物理位置<BR>(如限制性酶切位点和基因等)。标记可以是DNA中的表达<BR>区(如基因),也可以是目前不知道其编码功能的但其遗传<BR>情况可以得到确定的DNA片断。<BR>Multifactorial or<BR>multigenic disorder<BR>多基因病。参见Polygenic disorder。<BR>NCBI<BR>美国国立生物技术信息中心(National Center for<BR>Biotechnology Information),1988年设立,为美国国家医<BR>学图书馆(NLM)和国家健康协会(NIH)下属部门之一。<BR>提供生物医学领域的信息学服务,如世界三大核酸数据库之<BR>一的GenBank数据库,PubMed医学文献检索数据库等。<BR>PHYLIP<BR>J. Felsenstein 开发的一个被广泛应用于系统发生学研究的<BR>程序包。<BR>物理图谱。不考虑遗传,DNA中可识别的界标(如限制性酶<BR>切位点和基因等)的位置图。界标之间的距离用碱基对度<BR>Physical map<BR>量。对人类基因组而言,最低分辨率的物理图谱是染色体上<BR>的条带图谱;最高分辨率的物理图谱是染色体中完整的核苷<BR>酸序列。<BR>PIR<BR>Protein Identification Resource International, a protein<BR>database vendor.<BR>Polygenic disorder<BR>多基因病。由多于一个基因的等位基因共同导致的遗传疾病<BR>(如心脏病、糖尿病和某些癌症)。<BR>Polymorphism 多态现象。DNA序列中的个体差异。<BR>Promoter 启动子。DNA中被RNA聚合酶结合并从此起始转录的位点。<BR>Proteome 蛋白质组。一个基因组的全部蛋白产物及其表达情况。<BR>Ramachandran图<BR>虽然从理论上讲,蛋白质主链酰胺键作为单键,能够自由旋<BR>转(绕二面角f 、? ),但是空间位阻的存在使得f 、? 的取<BR>值局限于某一区域。对于已知晶体结构的蛋白质结构数据的<BR>统计分析表明主链的二面角f 、? 存在明显的取值范围,这<BR>种通过主链二面角f 、? 确定蛋白质分布区域的图形称为<BR>Ramachandran图。<BR>Regulatory region or<BR>sequence<BR>调控区或调控序列。控制基因表达的DNA碱基序列。<BR>Ribosomal RNA<BR>核糖体RNA。简写为rRNA。是一组存在于核糖体中的RNA分<BR>子。<BR>Sequence tagged site<BR>序列示踪位点,简写为STS。在人类基因组中只出现一次的<BR>位置和序列已知的长约200到500bp的短DNA序列片断。由<BR>于可以通过PCR检测到,STS在将来源于许多不同实验室的<BR>基因图谱和测序数据进行定位和定向时非常有用,并且STS<BR>在人类基因组的物理图谱中也具有界标的作用。表达的序列<BR>标签(ESTs)就是那些得自cDNAs的STSs。<BR>Sequencing<BR>测序。确定DNA或RNA分子中核苷酸序列,或者是确定蛋白<BR>质中氨基酸序列的过程。<BR>Single-gene disorder<BR>单基因病。由单个基因的等位基因的突变所导致的遗传病<BR>(如杜兴肌营养不良和成视网膜细胞瘤等)。<BR>Somatic cell<BR>体细胞。生物体中除了配子细胞及其前体细胞之外的所有细<BR>胞。<BR>SRS<BR>T. Etzold 开发的生物学数据库浏览系统。<BR>Tandem repeat<BR>sequences<BR>串联重复序列。染色体上同一碱基序列的多拷贝重复,在物<BR>理作图中用作标记物。<BR>Telomere<BR>端粒。染色体的末端结构,与线性DNA分子的复制和稳定性<BR>有关。<BR>UniGene<BR>美国国家生物技术信息中心提供的公用数据库,该数据库将<BR>GenBank中属于同一条基因的所有片断拼接成完整的基因进<BR>行收录。<BR>a—螺旋结构<BR>又称3.613螺旋,,多肽链主链螺旋结构中最常见类型,具<BR>有如下特征:<BR>1. 每圈包含3.6个残基,螺距0.54nm,残基高度<BR>0.15nm,螺旋半径0.23nm;<BR>2. 相邻螺旋间形成键内氢键<BR>3. 每个f 角等于-57°,每个? 角等于-47°。<BR>关于蛋白质分子结构中“非极性(疏水)残基存在于蛋白质<BR>氨基酸构象<BR>分子的内部,极性(亲水)残基大多存在于蛋白质分子的表<BR>面”的规则描述,体现氨基酸性质、构象的划分。研究结果<BR>表明,不同的氨基酸残基对蛋白质的折叠和三维结构具有明<BR>显不同的效应。<BR>1. 甘氨酸(Gly)唯一具有对称主链碳原子、最小残基。<BR>柔性大,体积小,常出现在需要运动和转折的肽链片<BR>断中;<BR>2. 脯氨酸(Pro)具有最强的立体化学效应,常常形成转<BR>角而改变主链的方向;环的空阻障碍将破坏规则二级<BR>结构如a螺旋、.折叠。在蛋白质分子中,经常出现在<BR>转角中且常暴露在蛋白质分子表面,位于亲水侧链的<BR>位置;<BR>3. 半胱氨酸(Cys)具有结合Fe、Fe-S及其它非蛋白质基<BR>团以及能够形成二硫键;具有三种存在类型:自由<BR>的—SH基团、配位的—SH基团、二硫键;常埋藏于分<BR>子内部,提高稳定性;<BR>4. 丙氨酸(Ala)可以出现在任何位置,最没有个性的氨<BR>基酸;<BR>5. 带有脂肪侧链的疏水氨基酸—缬氨酸(Val)、异亮氨<BR>酸(Ile)、亮氨酸(Leu)、蛋氨酸(Met)形成疏水<BR>中心,处于蛋白质内部,常出现在.结构中;<BR>6. 丝氨酸(Ser)能够被磷酸化,成为接糖位点,具有较<BR>强的化学活性,常作为活性部位残基;<BR>7. 苏氨酸(Thr)易于形成分子内、分子间氢键;常出现<BR>在.结构中;<BR>8. 天冬酰胺(Asn)方向唯一,常出现在转角1、3位;<BR>位于a螺旋开端,允许主链拐向另一方向;大量的研究<BR>结果表明,作为螺旋起点或糖结合点的Asn,Ser是其<BR>最保守替换;在转角1、3位置时,Asp是其最保守替<BR>换;在左手螺旋结构中,Gly是其保守替换;<BR>9. 谷酰胺(Gln)一般不与Asn替换,不出现在左手螺旋<BR>中,只能形成一般氢键;<BR>10. 天冬氨酸(Asp)、谷氨酸(Glu)—酸性氨基酸,出<BR>现在螺旋的第一圈,与螺旋的偶极发生作用;处于蛋<BR>白质外部,形成盐桥;常作为钙离子结合点;<BR>11. 赖氨酸(Lys)、精氨酸(Arg)—碱性氨基酸,位于<BR>螺旋最后一圈,处于蛋白外部,成为活性部位—Lys起<BR>结合作用,Arg常参与催化;Lys侧链柔性大,稳定蛋<BR>白质结构;Arg较Lys疏水性强,常常侧链弯曲形成疏<BR>水平面保守性替代Ile,Arg与Lys常不能进行保守替<BR>换;<BR>12. 组氨酸(His)唯一PH值接近中性的氨基酸,在周围环<BR>境发生微小变化即可使其获得或失去电荷,常作为活<BR>性位置残基;<BR>13. 芳香性氨基酸—苯丙氨酸(Phe)、酪氨酸(Tyr)、<BR>色氨酸(Trp),形成蛋白质内部疏水核心的的主要残<BR>基,均包含共轭p电子体系,是最佳电子给体;在一些<BR>氧化—还原酶的辅基相互作用、与核酸碱基键形成的<BR>配合物激发态的电荷转移相互作用中,色氨酸起着重<BR>要作用。<BR>表观静电势<BR>在探讨酶与底物的特异性结合、膜通道开关、蛋白质分子间<BR>相互作用等有关蛋白质结构功能关系,以及在蛋白质折叠、<BR>分子动力学模拟、分子设计等理论研究中,表观静电势的模<BR>型、方法的建立扮演着举足轻重的角色。目前,用于分析蛋<BR>白质表观静电势的理论方法、模型主要包括:微观模<BR>型:Warshel等基于Monte-Carlo及动力学模拟提出的处理手<BR>段,采用电荷分布、原子极化、溶剂游离表征体系的导电性<BR>质;宏观模型:利用经典静电方程和电化学中的离子氛<BR>理论引入介电常数进行处理。考虑到微观模型的限制,当前<BR>采用的多是建立在Debye-Huckel理论上的腔介质宏观模型。<BR>蛋白质结构<BR>蛋白质结构分为6个级别:一级结构、二级结构、超二级结<BR>构、结构域、三级结构、四级结构。一级结构意味着蛋白质<BR>的序列;二级结构为蛋白质中多肽主链的规则分布(如a螺<BR>旋、.折叠等),即肽链借助于氢键沿一维方向排列成具有<BR>周期性的结构构象;超二级结构代表二级结构单元间的组合<BR>方式(如all-a、all-.、a+.等),即相邻的二级结构单元相<BR>互组合,彼此作用,形成排列规则且在空间结构上能够辨认<BR>的二级结构组合体,并充当散剂结构的构件(Block<BR>Building),超二级结构是介于二级结构与结构域之间的结<BR>构层次;结构域是蛋白质折叠中的一个层次结构,在超二级<BR>结构的基础上,蛋白质进一步盘绕折叠形成紧密的近乎球状<BR>的结构;三级结构代表蛋白质的三维空间构象;四级结构则<BR>是指蛋白质亚基间通过疏水作用结合成的有序排列的特定空<BR>间构象。<BR>蛋白质三级结构的折叠类<BR>型<BR>根据每个结构域中二级结构单元的类型、数量、组合,主链<BR>骨架的各层相对于疏水核心的数目和形状,以及在一层中肽<BR>链之间连接的拓扑图等,将结构域的三级结构分为以下四种<BR>主要类型:<BR>1. 全a:顾名思义,三级结构全部由a—螺旋组成。该类<BR>型中最简单的亚类是升降螺旋捆(up-and-down helix<BR>bundle),即相邻的a—螺旋反向排列,头尾相接,形<BR>成类似筒状的螺旋捆或螺旋簇;另一个亚类是所谓的<BR>希腊花边螺旋捆(Greek Key Helix Bundle);<BR>2. 平行a/.:由a—螺旋和.-折叠沿着肽链方向交替存<BR>在,折叠组成多层结构。平行的.—折叠片层在内部,<BR>a—螺旋形成外部覆盖区;<BR>3. 反平行.结构:最常见的亚类是所谓的“希腊花边.<BR>筒”(Greek Key .—barrel)<BR>4. 不规则结构。<BR>蛋白质主链二面角<BR>蛋白质主链中包含三类二面角:f (二面角C—N—Ca<BR>—<BR>C)、? (二面角N—Ca<BR>—C—N)、? (二面角Ca<BR>—C—N —C<BR>a)。主链二面角取值范围:-180°~180°。<BR>基于准各态历经假设下,通过任何力学量对系综的平均等于<BR>该力学量对时间的平均,而力学量对时间的平均可以通过经<BR>典运动方程所决定的运动轨迹获得。通俗的说,分子动力学<BR>动态模拟即是在经典牛顿力学的基础理论上,给定分子势函<BR>分子动力学动态模拟<BR>数、力场,通过求解牛顿方程动态研究分子的运动与构象空<BR>间。1977年哈佛大学M. Karplus首次将该方法应用于蛋白质<BR>研究。<BR>分子对接<BR>在探讨蛋白质分子间相互作用(如酶与底物、受体与配基、<BR>膜通道开关等)、药物与受体间的相互作用时,分子对接方<BR>法(DOCK)是理论预测相互作用的必不可少的模型。分子<BR>对接方法基于作用物的空间互补、静电匹配的原则,在假定<BR>作用前后单体空间构象不发生变化的情况下,通过直观探讨<BR>作用结合部位的作用能量(包括分子间氢键、色散力、静电<BR>作用等)、作用构象确定最佳作用取向,进而研究分子间的<BR>相互作用。<BR>分子力学优化<BR>通过对分子能量的计算、构象调整,在一定的经典力场下,<BR>在分子势能面上寻找低能量构象。分子力学优化起始于能量<BR>的初函数,趋向势能面低能量的方向、距离,通过能量对距<BR>离的一阶偏微分达到收敛。常用的分子力学优化方法包括:<BR>最陡下降法、共轭梯度法、牛顿—拉普森方法。<BR>计算机辅助药物设计<BR>新兴边缘科学。以计算机为辅助工具,根据分子生物学实验<BR>积累的相关生物活性物质结构与功能的材料,以及药物在体<BR>内作用“靶点”即所谓受体的三维结构知识,设计具有特定<BR>疗效的药物分子,通过有机合成、药理测试,进而获得高<BR>效、低毒且具有较好生物利用度的分子,进入新药研究的下<BR>一个阶段。计算机辅助药物设计可以大大加快新药发现的速<BR>度,提高新药的开发效率,节省大量的人力、物力、财力。<BR>计算机辅助药物设计包括以下四种途径:<BR>1. 探索系列小分子药物空间构象于生物学功能关系,获<BR>得QSAR模型或药效基团模型,对现有化合物进行结构<BR>改造或进行全新药物设计(de novo);<BR>2. 根据已知药物结构预测受体结构模型,结合预测的模<BR>型进行药物设计;<BR>3. 在受体生物分子空间构象已经阐明的情况下,搜索药<BR>物分子数据库(MDL数据库,剑桥小分子数据库),<BR>通过几何形状、化学结构、表观静电分布等获得、设<BR>计与受体活性部位相互匹配的化合物;<BR>4. 利用组合化学的方法,在定量构效关系、受体结构要<BR>求、分子量等约束条件下,建立化学反应产物数据<BR>库,然后根据分子的差异性等条件挑选合适的化合物<BR>进行合成、测试,最终获得具有前途的化合物。<BR>量子化学从头计算(ab<BR>initio)<BR>基于量子力学微观理论,在非相对论近似、核冻结近似<BR>(Born-Oppenheimer近似)、轨道近似(单电子近似)的<BR>基础上,通过将分子轨道表示成原子轨道的线性组合,利用<BR>自洽场方法求解Hartree-Fock-Roothann方程,获得体系波<BR>函数,进而从微观角度进行性质研究。<BR>当前涉及从头算方法的软件包括:<BR>? Gaussian程序(Gaussian92、Gaussian94、<BR>Gaussian98等)<BR>? Turbermol程序<BR>? Dmol程序<BR>? SPARTAN程序等<BR>双重序列对比<BR>两序列间的对比分析。最常见的方法为Needle-Wunsch方<BR>法。能够利用的软件如BLAST、FASTA等。<BR>顾名思义,即基于目标序列的同源结构预测目标结构。一般<BR>地,同源模建的步骤如下:<BR>1. 从蛋白质晶体结构数据库(PDB)中搜索同源参考蛋<BR>白<BR>2. 从同源蛋白的结构信息确定结构保守区(Structural<BR>同源模建<BR>Conservative Region)<BR>3. 依据确定的结构保守区确定目标序列的结构保守区<BR>4. 对目标序列结构保守区构建主链<BR>5. 利用同源结构或构象搜索方法构建目标序列的可变区<BR>6. 由以上求得的目标蛋白的主链碳原子坐标寻求其它<BR>轻、重原子的坐标,完成侧链安装<BR>7. N、C端结构修饰<BR>8. 二硫键的形成<BR>9. 结构优化、评估<BR>由L-氨基酸组成的多肽链<BR>的基本构象<BR>规则构象f ? ? 螺距<BR>每螺距的<BR>残基数<BR>完全伸展的链+180 +180 +180 0.73 2.00<BR>右手a—螺旋-57 -47 +180 0.54 3.62<BR>左手a—螺旋+57 +47 +180 0.54 3.62<BR>3.010—螺旋-49 -26 +180 0.60 3.00<BR>p—螺旋-57 -70 +180 0.51 4.40<BR>平行.—结构-119 +113 +180 0.65 2.00<BR>反平行.—结<BR>构-139 +135 -178 0.70 2.00<BR>有机分子、生物大分子体<BR>系常用力场<BR>力场应用范围<BR>MM2/MM3 有机分子<BR>Amber 生物分子<BR>CHARMM 生物分子<BR>Tripos 有机分子、生物大分子<BR>YETI 包含金属的生物分子<BR>Universal<BR>所有类型的小分子(主族元素化合物、有机<BR>分子、金属配合物)<BR>Dreiding 主族元素组成的有机小分子、无机小分子<BR>GROMOS 生物大分子<BR>POLARIS 生物大分子<BR>非蛋白质编码区<BR>非蛋白质编码区(“Junk”DNA)占据了人类基因组的大部<BR>分,研究表明“Junk”是许多对生命过程富有活力的不同类<BR>型的DNA的复合体,它们至少包括以下类型的DNA成份或由<BR>其表达的RNA成分:内含子(intron)、卫星(Satellite)<BR>DNA、小卫星(minisatellite)DNA、微卫星<BR>(microsatellite)DNA、非均一核RNA(hmRNA)、短散置<BR>元(short interspersed elements)、长散置元(long<BR>interspersed elements)、伪基因(pseudogenes)等。除<BR>此之外,顺式调控元件,如启动子、增强子等也属于非编码<BR>序列。
页:
[1]