蛋白质

  蛋白质,一种复杂的有机化合物,旧称“朊”。是人体的必须营养素。由氨基酸分子呈线性排列所形成,相邻氨基酸残基的羧基和氨基通过形成肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。  1838年荷兰人G.J.米尔德首次采用“protein”(蛋白质)这一名称,它来自希腊文“proteios”一词,意为“第一位”。最初,人们把蛋白质作为生命胶态基质──原生质的同义语。1926年,詹姆斯·B·萨姆纳揭示尿素酶是蛋白质,首次证明了是蛋白质。第一个被测序的蛋白质是胰岛素,由弗雷德里克·桑格完成,他也因此获得1958年度的诺贝尔化学奖。首先被解析的蛋白质结构包括血红蛋白和肌红蛋白的结构,所用方法为X射线晶体学;该工作由马克斯·佩鲁茨约翰·肯德鲁于1958年分别完成,他们也因此获得1962年度的诺贝尔化学奖。  蛋白质是细胞组分中含量最为丰富、功能最多的高分子物质,在生命活动过程中起着各种生命功能执行者的作用,几乎没有一种生命活动能离开蛋白质。大多数微生物和植物能够合成所有20种标准氨基酸;动物则由于缺乏某些氨基酸合成途径中特定氨基酸合成反应所需的关键酶,如从天冬氨酸生成赖氨酸、甲硫氨酸和苏氨酸的合成反应第一步中发挥催化作用的天冬氨酸激酶,而只能合成部分氨基酸。因此,动物必须从食物中获取这些自身无法合成的氨基酸。一个生物体所无法合成而需从食物中获取的氨基酸被称为必需氨基酸。如果环境中存在所需氨基酸,微生物能够直接摄取这些氨基酸,而下调其自身的合成水平,从而节省了原来需要用于合成反应的能量。  动物所摄取的氨基酸来源于食物中所含的蛋白质。摄入的蛋白质通过消化作用而被降解,这一过程通常包括蛋白质在消化系统的酸性环境下发生变性,变性后的蛋白质被蛋白酶水解成氨基酸或小段的肽。随后这些降解片断就可以被吸收。部分吸收后的氨基酸被用于蛋白质的合成,其余的则通过糖异生作用被转化为葡萄糖或进入三羧酸循环进行代谢。蛋白质的营养作用在饥饿环境下显得特别重要,此时机体可以利用自身的蛋白质,特别是肌肉中的蛋白质,来产生能量以维持生命活动。蛋白质/氨基酸也是食物中重要的氮源。人体所需蛋白质在许多食物中都含量丰富,如动物肌肉、乳制品、蛋、豆类、谷类和蕈类等。人体中蛋白质缺乏可以导致全身浮肿、皮肤干燥病变、头发稀疏脱色、肌肉重量减轻、免疫力下降等。食物中的蛋白质有时会引起过敏反应。

蛋白质结构

  蛋白质具有十分复杂的结构。这种复杂性与生物分子有序性的高度统一,集中反映在蛋白质分子的结构具有丰富的层次。 1952年林诺斯特伦-朗首次使用一、二、三级结构的名称来粗略划分蛋白质分子的化学和空间结构。后来在三级结构以上又发展了四级结构,而且对上述各级结构的划分已有较为精确的定义,其中一级结构属于共价键结构,二级以上都属于空间结构。一级结构是其他各级结构的基础,蛋白质一级结构决定其高级结构特征,这是分子生物学中的一条基本规律。

·肽键和肽链

   在构成蛋白质时,氨基酸以肽键顺序相连。这样的产物称为肽;组成肽的相当于氨基酸的部分称为氨基酸残基。多个氨基酸可以这一方式顺序结合成一链状分子,称为多肽链或肽链。一般蛋白质分子都由大量氨基酸构成,所以,蛋白质就是具有特定空间卷曲和折叠的多肽链。  多肽链的共价主链形式上都是单键,因而-C-C-和-C-N-单键均应可自由旋转,但实际上,一个蛋白质的肽链在正常温度和pH的条件下具有一定的立体结构即构象,从而保证了蛋白质的生物活性。  蛋白质分子有的仅含一条多肽链,有的含有两条或多条多肽链,它们彼此以特定的方式 (共价或非共价)相互作用构成一个结构和功能的整体。  例如胰岛素是由A、B两条肽链组成,A、B链间由二对二硫键彼此连接,如将A、B链分离,胰岛素分子就完全受到破坏。有些多链蛋白质分子,其组成肽链可作为独立的结构单位,在完整的蛋白质分子内,它们彼此以非共价键相连接,而在被分离开来以后,又能保持其在完整分子内的共价键结构。这样的相对独立的肽链称为蛋白质的亚基。分离的亚基一般不再具有蛋白质完整分子的生物功能。由数量不多的亚基构成的蛋白质分子,也被称为寡聚体。

·一级结构

 
蛋白质分子的一级结构通式
  组成蛋白质分子的多肽链中氨基酸残基的排列顺序。蛋白质分子的一级结构通式如左图:  一级结构是蛋白质化学结构中最重要的内容,但完整的蛋白质化学结构,一般还包括:①多肽链的数目;②链间和链内的二硫键数目和位置;③与蛋白质分子共价结合的其他成分。

·二级结构

   指肽链主链原子的局部空间排布,不包括与其他肽链的相互关系以及侧链构象的内容,所以二级结构仅涉及蛋白质分子主链的构象。已观察到的蛋白质二级结构有下列 3种类型:①螺旋。最常见的是α-螺旋,除极个别例外,全部是右手螺旋;②β-折叠层。分平行式和反平行式两种;③β-转角或称β-回折。由4个氨基酸残基以第1和第4个残基间形成氢键稳定的三肽构象,这类构象可使肽链产生180°的转折,所以对蛋白质分子复杂而多样的三维折叠具有重要作用。此外在蛋白质分子中还有一些肽段不具有一定的有序的立体结构,通常称为无规则卷曲肽段。  在所有已测定的蛋白质结构中,都有广泛的二级结构存在,但在不同种类的蛋白质中,二级结构的分布和作用都很不一样。在纤维状蛋白质中,二级结构是分子的基本结构,并决定分子的一些基本特性,例如角蛋白主要由 α-螺旋构成,蚕丝的丝心蛋白主要由β-折叠层构成,胶原是由3股左手螺旋构成。在球状蛋白质中,二级结构是分子三维折叠的基本要素,对分子的骨架形成具有重要作用,但整个分子的错综复杂的三维特征更多地依赖于侧链的相互作用和除氢键以外的其他作用力, 在大多数球状蛋白质分子中,兼有各种二级结构,彼此并无一定的比例。
三种显示蛋白质三维结构的方式。图中蛋白质为磷酸丙糖异构酶(triose phosphate isomerase)。左:显示全部原子,并以原子类型标色(碳原子为蓝绿色,氧原子为红色,氮原子为蓝色);中:只显示主链构象,以二级结构类型标色(α螺旋为紫色,β折叠为黄色);右:显示“溶剂可及表面”,以残基类型标色(酸性氨基酸为红色,碱性氨基酸为蓝色,极性氨基酸为绿色,非极性氨基酸为白色)

·三级结构

   指蛋白质分子或亚基内所有原子的空间排布,但不包括亚基间或分子间的空间排列关系。可以理解为蛋白质分子内的肽链在二级结构的基础上(包括无规卷曲线团)在三维空间进一步折叠,盘曲形成包括蛋白质分子主链和侧链全部在内的专一性三维排布。可以说,所有具有重要生物功能的蛋白质都有严格的特定的三级结构。  蛋白质分子复杂的立体结构,是依靠复杂的作用力体系来稳定的,共价键和次级键均起重要的作用,如二硫键、氢键、疏水键、离子和范德华键,其中次级键占重要地位。

·四级结构

   指蛋白质亚基的立体排布,亚基间的相互作用与接触部位的布局,但不包括亚基内部的空间结构。多亚基蛋白质中亚基的数目、类型、亚基间的空间排布、亚基间的相互作用和接触部位的布局等都是蛋白质四级结构的范畴。  在寡聚体中的蛋白质亚基,有完全相同的,也有不同的。如过氧化物酶由4个相同的亚基构成,而血红蛋白分子则是由两种亚基 (α和β)各一对组成。四级结构对蛋白质的功能具有重要意义。  蛋白质并不完全是刚性分子。许多蛋白质在执行生物学功能时可以在多个相关结构中相互转换。在进行功能型结构重排时,这些相关的三级或四级结构通常被定义为不同“构象”,而这些结构之间的转换就被称为“构象变换”。例如,酶的构象变换常常是由底物结合到活性位点所导致。在溶液中,所有的蛋白质都会发生结构上的动态变化,主要表现为热振动和与其他分子之间碰撞所导致的运动。
细胞色素c的NMR溶液结构,显示了蛋白质的动态结构
  蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白、纤维蛋白和膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。  要了解特定蛋白质的功能,获得其三级结构或四级结构可以提供重要的结构信息。目前用于蛋白质的原子分辨率结构测定的方法主要是X射线晶体学和NMR光谱学。冷冻电子显微学也可以提供超大蛋白质复合物(如病毒、核糖体等)的低分辨率结构信息。而电子晶体学在一些情况下也可以提供较高分辨率的结构信息,特别是对于膜蛋白的二维晶体。解析的结构(包括原子坐标和结构解析的相关信息)通常存放到蛋白质数据库(PDB),供全世界研究者免费下载。结构预测也可以为未知结构(实验结构)的蛋白质提供结构信息。

蛋白质的生物化学性质

蛋白质结构中亮氨酸(肽键左侧)和丙氨酸(肽键右侧)通过肽键(用圈标出)连接在一起。其中,碳原子显示为绿色,氧原子为红色,氮原子为蓝色,并且没有显示氢原子
  蛋白质是由不同的L型α氨基酸所形成的线性聚合物。目前在绝大多数已鉴定的天然蛋白质中发现的氨基酸有20种(参见标准蛋白氨基酸列表)。不过在自然界中还存在着一些特殊的氨基酸,例如在一种海洋寡毛纲小蠕虫Olavius algarvensis以及与之存在共生关系的细菌δ1(该细菌属于δ变形菌)中存在着高含量的硒代半胱氨酸(Selenocysteine),由原本为终止密码子的UGA编码,和吡咯赖胺酸(Pyrrolysine),由终止密码子UAG编码。  所有氨基酸都有共同的结构特征,包括与氨基连接的α碳原子,一个羧基和连接在α碳原子上的不同的侧链。但脯氨酸有着与这种基本结构不同之处:它含有一个侧链与氨基连接在一起所形成的特殊的环状结构,使得其氨基在肽键中的构象相对固定。标准氨基酸的侧链是构成蛋白质结构的重要元素,它们具有不同的化学性质,因此对于蛋白质的功能至关重要。多肽链中的氨基酸之间是通过脱水反应所形成的肽键来互相连接;一旦形成肽键成为蛋白质的一部分,氨基酸就被称为“残基”,而连接在链的碳、氮、氧原子被称为“主链”或“蛋白质骨架”。由于肽键有两种共振态,具有一定的双键特性,使得相邻α碳之间形成肽平面;而肽键两侧的二面角确定了蛋白质骨架的局部形态。  由于氨基酸的非对称性(两端分别具有氨基和羧基),蛋白质链具有方向性。蛋白质链的起始端有自由的氨基,被称为N端或氨基端;尾端则有自由的羧基,被称为C端或羧基端。  “蛋白质”、“多肽”和“肽”这些名词的含义在一定程度上有重叠,经常容易混淆。“蛋白质”通常指具有完整生物学功能并有稳定结构的分子;而“肽”则通常指一段较短的氨基酸寡聚体,常常没有稳定的三维结构。然而,“蛋白质”和“肽”之间的界限很模糊,通常以20-30个残基为界。“多肽”可以指任何长度的氨基酸线性单链分子,但常常表示缺少稳定的三级结构。

蛋白质的功能

  蛋白质是细胞中的主要功能分子。除了特定类别的RNA,大多数的其他生物分子都需要蛋白质来调控。蛋白质也是细胞中含量最为丰富的分子之一;例如,蛋白质占大肠杆菌细胞干重的一半,而其他大分子如DNA和RNA则只分别占3%和20%。在一个特定细胞或细胞类型中表达的所有蛋白被称为对应细胞的蛋白质组。
肌球蛋白三维结构的飘带图,其主要由α螺旋所构成
  与其他生物大分子(如多糖和核酸)一样,蛋白质是地球上生物体中的必要组成成分,参与了细胞生命活动的每一个进程。酶是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白和肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导、免疫反应、细胞黏附和细胞周期调控等。同时,蛋白质也是人们日常饮食中必需的营养物质,这是因为动物自身无法合成所有必需氨基酸;通过消化所摄入的蛋白质食物(将蛋白质降解为氨基酸),人体就可以将吸收的氨基酸用于自身的蛋白质合成。  蛋白质能够在细胞中发挥多种多样的功能,涵盖了细胞生命活动的各个方面:发挥催化作用的酶;参与生物体内的新陈代谢的调剂作用,如胰岛素;一些蛋白质具有运输代谢物质的作用,如离子泵和血红蛋白;发挥储存作用,如植物种子中的大量蛋白质,就是用来萌发时的储备;许多结构蛋白被用于细胞骨架等的形成,如肌球蛋白;还有免疫、细胞分化、细胞凋亡等过程中都有大量蛋白质参与。  蛋白质功能发挥的关键在于能够特异性地并且以不同的亲和力与其他各类分子,包括蛋白质分子结合。蛋白质结合其他分子的区域被称为结合位点,而结合位点常常是从蛋白质分子表面下陷的一个“口袋”;而结合能力与蛋白质的三级结构密切相关,因为结构决定了结合位点的形状和化学性质(即结合位点周围的氨基酸残基的侧链的化学性质)。蛋白质结合的紧密性和特异性可以非常高;例如,核糖核酸酶抑制蛋白可以与人的血管促生蛋白angiogenin以亚飞摩尔(sub-femtomolar,即<10-15 M)量级的解离常数进行结合,但却完全不结合(解离常数>1 M)angiogenin在两栖动物中的同源蛋白抗肿瘤核糖核酸酶(onconase)。非常微小的化学结构变化,如在结合位点的某一残基侧链上添加一个甲基基团,有时就可以几乎完全破坏结合;例如,氨酰tRNA合成酶可以分辨侧链结构非常类似的缬氨酸和异亮氨酸,而这两种氨基酸的差别就在于异亮氨酸的侧链多出一个甲基。相同的蛋白质分子结合在一起就可形成同源寡聚体或多聚体,有些多聚体可以形成纤维;而这些形成纤维的蛋白质往往是结构蛋白,它们在单体状态下是球蛋白,通过自结合来形成刚性的纤维。蛋白-蛋白相互作用可以调控酶的活性和细胞周期中的各种进程,并可以使大型的蛋白质复合物得以形成,这样可以将参与同一生物学功能的分子结合到一起,从而提高其工作效率;而结合所诱导的蛋白构象变化对于复杂的信号传导网络的构建也是必不可少的。还有一些蛋白质(如膜蛋白)可以结合或者插入到细胞膜中。

·催化功能

   有催化功能的蛋白质称酶,生物体新陈代谢的全部化学反应都是由酶催化来完成的,器官的分化、肿瘤细胞的转化等也和酶的活动有关。

·运动功能

   从最低等的细菌鞭毛运动到高等动物的肌肉收缩都是通过蛋白质实现的。肌肉的松弛与收缩主要是由以肌球蛋白为主要成分的粗丝以及以肌动蛋白为主要成分的细丝相互滑动来完成的。这一过程中还有很多具有调节功能的蛋白质参加。自60年代始相继发现在很多植物以及原生生物中也有运动蛋白。其中有一些与肌肉收缩蛋白相似,也有一些是完全不同的,如微管蛋白、鞭毛蛋白等。

·运输功能

   在生命活动过程中,许多小分子及离子的运输是由各种专一的蛋白质来完成的,例如在血液中,血浆白蛋白运送小分子、红细胞中的血红蛋白运送氧气和二氧化碳等。

·机械支持和保护功能

   高等动物的具有机械支持功能的组织如骨、结缔组织以及具有覆盖保护功能的毛发、皮肤、指甲等组织主要是由胶原、角蛋白、弹性蛋白等组成。

·免疫和防御功能

   生物体为了维持自身的生存,拥有多种类型的防御手段,其中不少是靠蛋白质来执行的。例如抗体即是一类高度专一的蛋白质,它能识别和结合侵入生物体的外来物质,如异体蛋白质、病毒和细菌等,取消其有害作用。

·调节功能

   在维持生物体正常的生命活动中,代谢机能的调节,生长发育和分化的控制,生殖机能的调节以及物种的延续等各种过程中,多肽和蛋白质激素起着极为重要的作用。此外,尚有接受和传递调节信息的蛋白质,如各种激素的受体蛋白等。  蛋白质作为生命活动中起重要作用的生物大分子,与一切揭开生命奥秘的重大研究课题都有密切的关系。蛋白质是人类和其他动物的主要食物成分,高蛋白膳食是人民生活水平提高的重要标志之一。许多纯的蛋白质制剂也是有效的药物,例如胰岛素、人丙种球蛋白和一些酶制剂等。在临床检验方面,测定有关酶的活力和某些蛋白质的变化可以作为一些疾病临床诊断的指标,例如乳酸脱氢酶同工酶的鉴定可以用作心肌梗塞的指标,甲胎蛋白的升高可以作为早期肝癌病变的指标等。在工业生产上,某些蛋白质是食品工业及轻工业的重要原料,如羊毛和蚕丝都是蛋白质,皮革是经过处理的胶原蛋白。在制革、制药、缫丝等工业部门应用各种酶制剂后,可以提高生产效率和产品质量。蛋白质在农业、畜牧业、水产养殖业方面的重要性,也是显而易见的。

蛋白质结构和功能的关系

 

·变性和复性

   蛋白质分子在受到外界的一些物理和化学因素的影响后,分子的肽链虽不裂解,但其天然的本体结构遭致改变和破坏,从而导致蛋白质生物活性的丧失和其他的物理、化学性质的变化,这一现象称为蛋白质的变性。早在1931年中国生物化学家吴宪就首次提出了正确的变性作用理论。  引起蛋白质变性的主要因素有:①温度。许多溶液中的蛋白质在温度升高至50~60℃以上时,就会变性。热变性常引起蛋白质的聚合和沉淀,一般难于复性;②酸碱度。蛋白质溶液的过高或过低的pH值均会破坏蛋白质结构的稳定性,从而导致变性;③有机溶剂。通过影响蛋白质分子内的静电力,氢键和疏水作用,有机溶剂常诱导蛋白质的变性;④脲和盐酸胍。这是应用最广泛的蛋白质变性试剂。一般认为,这类试剂的变性作用在于它们使蛋白质分子内部的疏水基团暴露于溶剂中;⑤去垢剂和芳香环化合物。去垢剂如十二烷基硫酸钠 (SDS)很易引起多亚基蛋白质解离为单亚基蛋白质和亚基的变性。一些多环化合物,如蒽和菲,也都能引起蛋白质的变性。  蛋白质的变性有很大的范围,可以是少数侧链取向的改变,也可以是所有原子的空间位置都发生显著变化。蛋白质的变性常伴随有下列现象:①生物活性的丧失。蛋白质的生物活性是指其所具有的酶、激素、毒素、抗体等专一的活性以及其他的特殊性质,如血红蛋白的载氧能力,肌球蛋白和肌动蛋白相互结合的能力等。当蛋白质发生变性时,生物活性就会部分或全部丧失,这是蛋白质变性的最主要特征;②化学性质的改变。表现在一些侧链基团的暴露。蛋白质在变性时,由于肽链的伸展,使得有些原来隐藏在分子内部而不易与化学试剂起反应的侧链活性基团暴露出来,如半胱氨酸中的SH基,酪氨酸中的苯酚基等。化学性质的改变还表现在蛋白质变性后,易为蛋白酶所水解,水解部位增多,被水解的速度有很大的提高;③物理性质的改变。大多数天然的球状蛋白质均可结晶,但变性后即失去结晶能力。蛋白质变性后,溶解度降低。肽链的伸展使分子的不对称程度提高,这往往导致粘度增加,扩散系数降低,旋光值改变以及出现流动双折射等一系列物理性质的变化。  在变性因素去除以后,变性的蛋白质分子又可重新回复到变性前的天然的构象,这一现象称为蛋白质的复性。蛋白质的复性有完全复性、基本复性或部分复性。只有少数蛋白质在严重变性以后,能够完全复性。一般认为,大多数蛋白质不能完全复性的原因在于变性态可能处在一个非天然的亚稳态,或者由于天然结构本身可能在热力学上就不是一个总体能量最低的状态。  蛋白质变性和复性的研究,对了解体内体外的蛋白质分子的折叠过程十分重要。主要通过蛋白质的变性和复性的研究,肯定了蛋白质折叠的自发性,证实了蛋白质分子的特征三维结构仅仅决定于它的氨基酸序列。在这方面作出重要贡献的典型研究实例是美国C.B.安芬森小组关于牛胰核糖核酸酶的变性和复性的研究。牛胰核糖核酸酶含有124个氨基酸残基,由8个巯基配对组成4对二硫键。可以计算出酶分子中8个巯基组成4对二硫键的可能方式有105种,这就提供了一个定量估算复性重组的指标。在温和的碱性条件下,8摩尔的浓脲和大量巯基乙醇能使四对二硫键完全还原,整个分子变为无规则卷曲状,酶分子变性。透析去除脲,在氧的存在下,二硫键重新形成,酶分子完全复性,二硫键中成对的巯基都与天然一样,复性分子可以结晶且具有与天然酶晶体相同的X射线衍射花样,从而证实,酶分子在复性过程中,不仅能自发地重新折叠,而且只选择了105种二硫键可能配对方式中的一种。

·蛋白质的激活

   活性蛋白质分子在生物体内刚合成时,常常不呈现活性,即不具有这一蛋白质的特定的生物功能。要使蛋白质呈现其生物活性,一个非常普遍的现象是,蛋白质分子的肽链在一些生化过程中必须按特定的方式断裂。例如许多酶有一个不具有活性的前体,称为酶原。酶原经过专一的蛋白水解酶的作用,将某一特定的肽链断裂,切去一段或几段肽链以后,变成有活性的酶,使无活性的酶原变成有活性的酶的过程称为酶原的激活作用。此外,许多蛋白质激素也有前体。如胰岛素原,在A链N端与B链C端之间有一段C肽,经专一的酶水解而释放出C肽,变成胰岛素。  蛋白质的激活是生物的一种调控方式,这类现象在各种重要的生命活动中广泛存在,如血纤维蛋白原到血纤维蛋白的转化;又如在噬菌体的外壳蛋白的装配过程中,也有大量的前体肽链断裂的情况。

·亚基的调节

   很多蛋白质由亚基组成,这类蛋白质在完成其生物功能时,在效率和反应速度的调节方面,很大程度上依赖于亚基之间的相互关系。如血红蛋白和肌红蛋白在不同的组织中都结合氧,但前者输氧后者贮存氧,任务不同。从结构上看肌红蛋白仅有一条肽链,而血 红蛋白有四条以非共价键结合的肽链 (两条α-链和两条β-链),即有4个亚基。尽管血红蛋白的亚基和肌红蛋白肽链在一级、二级、三级结构方面很相似,但由于血红蛋白有四级结构,因此血红蛋白和肌红蛋白的氧结合曲线有很大不同,血红蛋白为S形曲线,肌红蛋白为双曲线,这是由于血红蛋白分子对氧的结合是 4个亚基协同作用的结果。当第一个α-亚基和氧结合时,其立体结构发生改变,通过亚基之间的相互作用,引起其余亚基的立体结构的变化,从而提高其余亚基对氧的亲和力,这种现象也称为别构效应。  亚基参与蛋白质功能的调节是一个相当普遍的现象,特别在调节酶的催化功能方面。有些酶存在和活性部位不重叠的别构部位,别构部位和别构配体相结合后,引起酶分子立体结构的变化,从而导致活性部位立体结构的改变,这种改变可能增进,也可能钝化酶的催化能力。这样的酶称为别构酶。已知的别构酶在结构上都有两个或两个以上的亚基。例如天冬氨酸转氨甲酰酶是一个具有6个催化亚基和6个调节亚基的12聚体。胞嘧啶核苷三磷酸是这一酶的别构配体,它能首先和酶的调节亚基相结合,引起调节亚基立体结构的变化,这一变化传导至催化亚基,导致酶的催化活力降低。

蛋白质合成

·生物合成

  编码一个蛋白质氨基酸序列的基因的DNA序列每一种蛋白质都有自己独特的氨基酸序列,而氨基酸序列的组成信息则由编码对应蛋白质的基因的核苷酸序列所决定。遗传密码是一套由三个核苷酸组成的密码子,每一种三个核苷酸的组合可以编码一种特定氨基酸,如mRNA上的AUG(在DNA中为ATG)编码甲硫氨酸。由于DNA含有四种核苷酸(A、T、C、G),所以对应的可能的密码子有4×4×4=64种;而标准氨基酸只有20种,因此有部分密码子是冗余的,即部分氨基酸可以由多个不同的密码子所编码。DNA中的基因首先在RNA聚合酶等蛋白质的作用下被转录为前mRNA。在大多数生物体中,前mRNA(或初始转录产物)要经过转录后修饰以形成成熟的mRNA,随后mRNA就可以经由核糖体被用作蛋白质合成的模板。在原核生物中,mRNA可能可以在生成后被直接用于蛋白质合成,或者在离开类核后就结合核糖体。而在真核生物中,mRNA在细胞核中被合成,然后通过核膜被转运到细胞质中;在细胞质中,mRNA才可以被用于蛋白质合成。原核生物的蛋白质合成速率可以达到每秒20个氨基酸,要高于真核生物。  从一个mRNA模板合成一个蛋白质的过程被称为翻译。在翻译过程中,mRNA被一些蛋白质携带到核糖体上;然后核糖体在mRNA上从5'端到3'端寻找起始密码子(大多数情况下为AUG);找到起始密码子后,即核糖体上起始tRNA的反密码子与起始密码子配对后,翻译就可以开始进行;在起始密码子后,核糖体每一次阅读三个核苷酸(或一个密码子),同样是通过携带对应氨基酸的tRNA上反密码子与密码子配对。其中,氨酰tRNA合成酶可以将tRNA分子与正确的氨基酸连接到一起。不断延长的多肽链通常被称为“新生链”。生物体中的蛋白质合成总是从N-端到C-端。  合成的蛋白质的大小可以通过其含有的氨基酸数目或者其分子量(以道尔顿或千道尔顿,即kDa为单位)来衡量。酵母蛋白的平均长度为466个氨基酸或平均分子量为53kDa。目前已知的最大蛋白质是titin,titin是肌肉中肌节的组分之一,其分子量为近3,000 kDa,含有近27,000个氨基酸。

·化学合成

  除了生物合成外,一些小的蛋白质可以通过多种化学途径来合成,这些合成方法又被称为肽合成,其依赖于有机合成技术,如化学连接来高通量生产肽。化学合成允许在合成的肽链中引入非天然氨基酸,如加入荧光标记的氨基酸。这些合成方法所合成的产物被大量应用于生物化学和细胞生物学实验。但是,化学合成无法有效合成残基数多于300的蛋白质,而且合成的蛋白质可能不具有天然的三级结构。大多数化学合成方法都是从C-端到N-端进行合成,刚好和生物合成反应的方向相反。

研究简史

  在18世纪,安东尼奥·弗朗索瓦(Antoine Fourcroy)和其他一些研究者发现蛋白质是一类独特的生物分子,他们发现用酸处理一些分子能够使其凝结或絮凝。当时他们注意到的例子有来自蛋清、血液、血清白蛋白、纤维素和小麦面筋里的蛋白质。荷兰化学家Gerhardus Johannes Mulder对一般的蛋白质进行元素分析发现几乎所有的蛋白质都有相同的实验公式。  1820年H.布拉孔诺发现甘氨酸和亮氨酸,这是最初被鉴定为蛋白质成分的氨基酸,以后又陆续发现了其他的氨基酸。1849年K.B.赖歇特获得了马血红蛋白的晶体,开始了纯化各种蛋白质的工作;以后G.J.米尔德等人系统地研究了蛋白质的元素组成,发现它与其他有机分子一样,是一种特定的分子实体。到19世纪末已经搞清蛋白质主要是由一类相当简单的有机分子──氨基酸所组成。1902年E.菲舍尔和F.霍夫迈斯特各自独立地阐明了在蛋白质分子中将氨基酸连接在一起的化学键是肽键;1907年E.菲舍尔又成功地用化学方法连接了18个氨基酸首次合成了多肽,从而建立了作为蛋白质化学结构基础的多肽理论。1923年T.斯韦德贝里建立了超离心分析技术,并应用到蛋白质的分子量测定。1939年T.斯韦德贝里提出了纯的蛋白质是一种分子量相同的均一大分子的概念。  20世纪30~40年代,由于生物化学及其他有关的方法和技术的建立和发展,人们开始研究蛋白质的分子构造和理化性质,其间,超离心技术(T.斯韦德贝里,1930),电泳技术 (A.W.K.蒂塞利乌斯,1933),分配层析(钮贝格,1938),凝胶层析(A.J.P.马丁和R.L.M.辛格,1941),纸层析(R.康斯登等,1944)技术以及光散射测量,粘度测量,扩散技术等,对分离,纯化蛋白质和了解蛋白质的性质均有卓越的贡献。1947年F.桑格发现一种可以辨认蛋白质氨基端残基的试剂(1-氟-2,4-二硝基苯),使蛋白质的氨基酸序列分析成为可能。1955年F.桑格成功地测定了胰岛素分子的全部氨基酸序列,这是第一个被阐明了氨基酸序列结构的蛋白质。此后,已有上千种,包括分子量大于10万的蛋白质的氨基酸序列结构被阐明,这对深入研究蛋白质结构和功能的关系起了重要的作用,也是分子遗传学和遗传工程发展的重要基础之一,同时还把生物分类,进化等古老学科推向崭新的分子水平。  著名化学家莱纳斯·鲍林成功地预测了基于氢键的规则蛋白质二级结构,而这一构想最早是由威廉·阿斯特伯里于1933年提出。随后,Walter Kauzman在总结自己对变性的研究成果和之前Kaj Linderstrom-Lang的研究工作的基础上,提出了蛋白质折叠是由疏水相互作用所介导的。1949年,弗雷德里克·桑格首次正确地测定了胰岛素的氨基酸序列,并验证了蛋白质是由氨基酸所形成的线性(不具有分叉或其他形式)多聚体。原子分辨率的蛋白质结构首先在1960年代通过X射线晶体学获得解析;到了1980年代,NMR也被应用于蛋白质结构的解析;近年来,冷冻电子显微学被广泛用于对于超大分子复合体的结构进行解析。截至到2008年2月,蛋白质数据库中已存有接近50,000个原子分辨率的蛋白质及其相关复合物的三维结构的坐标。

蛋白质研究方法

  蛋白质是被研究得最多的一类生物分子,对它们的研究包括“体内”(in vivo)和“体外”(in vitro)。体外研究多应用于纯化后的蛋白质,将它们置于可控制的环境中,以期获得它们的功能信息;例如,酶动力学相关的研究可以揭示酶催化反应的化学机制和与不同底物分子之间的相对亲和力。而体内研究实验着重于蛋白质在细胞或者整个组织中的活性作用,从而可以了解蛋白质发挥功能的场所和相应的调节机制。

·蛋白质纯化

  为了进行in vitro研究,必须先将目的蛋白质从其他细胞组分中分离提纯出来。这一过程通常从细胞裂解开始(对于分泌性蛋白质的提纯则不需要裂解细胞),通过破坏细胞膜将细胞内含物释放到溶液中,从而获得含有目的蛋白质的细胞裂解液。然后通过超速离心将细胞裂解液中膜脂和膜蛋白、细胞器、核酸以及含有可溶蛋白质的混合物。盐析法是一种较为常用的通过沉淀从裂解液中分离浓缩蛋白质的方法。基于目的蛋白质的化学性质(如分子量、带电情况和结合活性),可以利用不同的色谱法来进一步分离提纯蛋白质。纯化的程度可以用电泳(已知目的蛋白质的分子量)、光谱学(目的蛋白质具有独特的光谱学特征)或者酶活分析反应(目的蛋白质具有特定的酶活性)来衡量。  对于天然蛋白质,可能需要一系列的纯化步骤才能获得纯度足以用于实验室应用的蛋白质。为了简化这一过程,通常采用基因工程的手段在目的蛋白质上添加一些化学特性,在不改变其结构和生物学活性的情况下使纯化过程更为简单。通常是将含有特定氨基酸序列的“标签”连接在目的蛋白质的N-端或C-端。例如,含有连续多个组氨酸的序列,称为组氨酸标签(His-tag);将含有带组氨酸标签蛋白质的裂解液流过含有镍的亲和层析柱,组氨酸就可以与镍螯合从而结合在柱子上,而裂解液中其他蛋白质由于没有组氨酸标签而直接流出柱子,从而达到分离目的。通过基因工程(即DNA重组)改造而获得的蛋白质被称为重组蛋白质。

·细胞内定位

  in vivo的蛋白质研究常常专注于蛋白质在细胞中的合成和定位。虽然已经知道许多细胞内蛋白质是在细胞质中合成,而膜结合蛋白质或分泌性蛋白质是在内质网中合成,但蛋白质定位到特定细胞器或细胞结构的特异性是如何达到的,目前还不清楚。一些有助于获得特定蛋白质在细胞中定位的方法得到了发展,特别是用基因工程将目的蛋白质上连接上“报告者”(如绿色荧光蛋白),将这样的融合蛋白在细胞中表达后,就可以通过显微镜观察荧光来了解融合蛋白在细胞中的分布。  另一种常用的同样是基因工程的方法为定点突变。利用这一方法,研究者可以改变蛋白质序列,从而改变其结构、细胞内定位以及调控机制;而这些改变可以在in vivo的情况下通过连接绿色荧光蛋白,或者在in vitro的情况下通过酶动力学的方法以及结合实验进行观察。

·蛋白质组学与生物信息学

  在一定时间内一个细胞或一类细胞中存在的所有蛋白质被称为蛋白质组,研究如此大规模的数据的领域就被称为蛋白质组学,与基因组学的命名方式相似。蛋白质组学中关键的实验技术包括用于检测细胞中大量种类蛋白质相对水平的蛋白质微阵列技术,和用于系统性研究蛋白-蛋白相互作用的双杂交筛选技术。此外,还有探究所有组分之间的可能的生物学相互作用的相互作用组学,以及系统性地解析蛋白质结构,并揭示其中的可能的折叠类型的结构基因组学。  目前各类数据库中含有许多种类的生物体的大量的基因组和蛋白质组数据,包括人类基因组的数据;要对这些数据进行分析已获得有用的信息,就需要用到近来来发展起来的新兴学科──生物信息学。生物信息学的发展使得现在研究者可以通过序列比对有效地鉴定相关生物体的同源蛋白质。利用序列信息推导工具(sequence profiling tool)可以对更特异地对序列进行分析,如限制酶图谱、针对核酸序列的开放阅读框架分析以及二级结构预测。利用特定软件,如ClustalW,可以从序列信息中可以构造出系统树并进行进化分析。生物信息学的研究领域包括集合、注释和分析基因组和蛋白质组数据,这就需要应用计算技术于生物学问题,如基因识别和支序分类。

·结构预测与模拟

  作为结构基因组研究的互补,蛋白质结构预测的目标是发展出有效的能够提供未知结构(未通过实验方法得到)蛋白质的可信的结构模型。目前最为成功的结构预测方法是同源建模;这一方法是利用序列相似的蛋白质(已知结构)的结构作为“模板”。而结构基因组的目标正是通过解析大量蛋白质的结构来为同源建模提供足够的模板以获得剩余的未解析的同源蛋白结构。从序列相似性较差的模板计算出精确的结构模型对于同源建模法还是一个挑战,问题在于序列比对准确性的影响,如果能够获得“完美”的比对结果,则能够获得精确的结构模型。许多结构预测方法已经被用于在蛋白质工程领域,在这些方法的帮助下,研究者们设计出一些新型的蛋白质折叠类型。更为复杂的结构计算是预测蛋白质分子之间的相互作用,需要应用分子对接法和蛋白-蛋白相互作用预测。  利用分子动力学的方法可以模拟蛋白质的折叠和结合过程。通过分布式计算,如Folding@Home计划,为分子动力学模拟注入了活力。小的α螺旋蛋白结构域,如villin的头部和HIV辅助蛋白已经成功地在计算机中(in silico)被模拟。将分子动力学和量子力学相结合的方法已经被用于探索视网膜色素分子的电子态。