Exonは小さく、Intronはとても大きい事が多い。 だが通常のSplicingの図解ではそのスケールが表されていないので、難しさが分かりにくい所がある。
そこでここではゲノム的な視点でそれぞれのスケールなどを見ていこう。
項目 | 人間 | D.melanogaster(ハエ) |
---|---|---|
mean exon length | 320nt | 494nt |
median exon length | 145nt | 272nt |
mean intron length | 7563nt | 2068nt |
median intron length | 1964nt | 642nt |
exonはタンパク質の1ドメインや、時には異なるspecifityの為の14AAという場合もあるように、とても短くなりうる。 平均では50〜250 ntくらいの長さ。せいぜい500nt程度に収まる。
intronは数千とかのオーダーでさらにもっと長い事もある。
この大量のintronの中からexonを探す、というのは、なかなか難しいタスクといえる。
premRNAのsplicingなどでも見たメカニズムから考えると、spliceすることになるintronの両端にタンパク質がくっついてどこをSpliceするかが決まりそうに見えるが、 実際は少なくとも哺乳類に関しては、最初にexonがタンパク質に認識されている証拠がある。
つまり、A complexの形成で最初に結合するU1とU2は、Spliceする相手同士では無く、exonの両脇同士の二人となる。
だからSpliceの反応の進み方としては、
ではこのexonをどうやって見つけていくのだろうか?以下に見ていく。
RNAポリメラーゼIIはEukaryoticTranscriptionのInitiationとElongationやEukaryoticTranscriptionTerminationで見たように、C-terminal domainにリン酸化されてる尻尾を持つ。 このC-terminal側の尻尾のリン酸化は、複数のリン酸化される場所があって、 どこがリン酸化されているかで役割が変わる。
EukaryoticTranscriptionTerminationでも見たように、大きくSer5-PiとSer2-Piがある。
Ser5-Piが多い時は合成されるRNAの5’側をcappingする酵素をリクルートし、 Ser5-Piが減ってSer2-Piが(相対的に)増えるとsplicingと3’側をpolyadenylationする機構を助ける。
このSer2-Piの状態のC-terminal tailは、Splicing componentsのローディングを助ける。 つまりRNA Pol IIはpre-mRNAを合成しつつ、splicingに関わるタンパク質を必要な場所にくっつけていく。
Splicingの補助を考える上では、Enhancersにどのようなものがあるのかを知っておく必要がある。 そこでEnhancersと、ついでにSuppressorsも見ておこう。
2つのタンパク質ファミリーがある。
SRやhnRNPはintronやexonのsmall redundant sequencesに結合する。(小さい繰り返し配列)
exonに結合してsplicing反応を助けるタンパク質をESE(exonic splicing enhancer)、intronに結合してsplicing反応を助けるタンパク質をISE(intronic splicing enhancer)と呼ぶ。 SRはESEやISEの一種。
同様にinhibitの方をESS(exonic splicing silencer)、ISS(intronic splicing silencer)と呼ぶ。こちらはhnRNPなど。
SRがどのようにsplicingを促進するかを見てみる。 SRがexonに結合すると、3’側にU1を、5’側にU2 AFやU2を、結合するのを促進する。
結合を促進するメカニズムの一つに、co-activator modelというのが考えられている。 このケースでは、SRとSRに関連するタンパク質が結合してSR-related protein complexを形成し、 これがRNAやsplicing factorsと相互作用する、というモデル。
また別のケースではもっと単純にSRがexonの3’側のU1の結合する場所のそばに結合して、U1とも相互作用して正しいsplicing siteに結合するのを助ける、 という場合もある。
hnRNPがsplicingを抑制するメカニズムを幾つか見ていこう。
一番単純なのは単にsplicing factorsが結合する所(またはその付近)に先に結合して、物理的に(stericに)結合を邪魔する、というもの。
もっと長い範囲に影響するメカニズムとしては、RNAの2つの離れた場所に結合したhnRNP同士が結合して、輪っかを形成し、 その間でsplicingが起こるのを妨げる、というものもある。
また、cooperativeなhnRNPが、一つがくっつくと他のがくっつきやすくなって、他のがくっつきやすくなるとさらに他のが…となってhnRNPで覆われてsplicingが行われなくなる、というメカニズムもある。
テンプレートのクロマチンの状態も、pre-mRNAのexonの識別に影響を与える。
exon(のテンプレート)の付近でChIP-seqして調べると、exonのあたりではpost translationallyに修正されたH3K27me2と呼ばれるヒストンが多く見られた。 exonの中心からの距離と発現数をプロットするとexonの中心をピークに山になっているのが見て取れる。>Assays
alternative splicingでexonが飛ばされる率が高い細胞と低い細胞でヒストンを調べると、特定の種類のヒストンが多いと飛ばされず、低いと飛ばされる、という事が確かめられる。
メカニズムは幾つか考えられる。
1つ目、ある種のヒストンはRNA Pol IIの動きを遅くする。 遅くなると、splicing機構が弱めのsplicing siteでも働き始める準備が整う確率が上がる。 こうして、普段飛ばされがちなexonを含めるような効果を発揮出来る。
2つ目、ある種のヒストンが多い領域は、splicingのenhancersやsuppressorsを集める働きをして、splicing機構を活性化させたり抑制したりする。
RNAとタンパク質が結合しているかを調べるassay。
ラベル付けしたRNAとタンパク質を入れて、電気泳動する。タンパク質がくっついていると動きが遅くなる。 これで特定の変異の与える影響などを調べたり、タンパク質の濃度を変えて行って結果を見たりなど、いろいろな亜種がある。
タンパク質の濃度を変えて行って結果を見ていくと、何nanomolarで50%くらいくっつくかを判定する事で、 割と良いbinding affinityの推計が出来る。
RNAと結合しているタンパク質を調べるassay
biotin-streptavidin beadsの結合はとても強くて15 femtomolar。
タンパク質を特定する手法としては、
結合する配列の方を調べるassayとしてSELEXをRNAに使えるように修正したものがある。 SELEXはEukaryoticTranscriptionのDNABindingRegulatorsで出てきたassay。Assays参照。
こうして目的のタンパク質が好む配列を見つけたら、これを着目しているgeneの中から探す。
目的のタンパク質がRNAのどこに結合するかを調べるassay。
Splicing Regulationが実際にどのように使われるかの例を2つ見ていく。
イースト菌の胞子は過酷なコンディションでも残りやすいので、 飢餓が訪れるとイースト菌は減数分裂を行って胞子に未来を託す。
geneを大文字で、生成するタンパク質を頭文字だけ大文字で表す、UME6とUme6など。
飢餓などのストレスにより、UME6の転写がactivateされてUme6が生成される。 Ume6はMER1のactivateを助け、さらにMER2, MER3, SPO22, SPO70などの減数分裂に関わるgeneの発現も促進する。
Mer1はMER2, MER3, SPO22, SPO70などの、U1の弱い5’ splice siteとの結合を助け、これがこれらのRNAのalternative spliceを引き起こす。 このalternative spliceの結果、Meiosisに必要なタンパク質が生成されるようになる。
通常のU1 splice siteとU1の関係は以下。
名前 | 配列 |
---|---|
U1 | 3’-CAUUCA-5’ |
通常のconsensus 5’ splice site | 5’-GU(GA)AGU-3’ |
MER2の弱い5’ splice site | 5’-GUUCGU-3’ |
通常は6AA中、5〜6個ペアリングするが、MER2の場合は4つしかペアリングしない。
これがMer1とU1 snRNPが結合してこのMer1の助けがあると、RNAとの結合が強化される。
発生時期の性の違いのほとんどはalternative splicing違いで決められている。
Sex lethal (略称Sxl)と呼ばれるタンパク質がある。
さらに Sxlー>Traー>Dsx(FかM) というpathwayがある。
TraはTransformer proteinとも呼ばれるとか。 DsxのFはfemale、DsxのMはmale。(上付き添字で書かれているが、ノートはこの書き方で)
このpathwayでそれぞれがenhancerになったりsuppressorになったりするのを見ていこう。
X染色体の数の違いによりSxlの量がメスの方が多く、このSxlがSxl pre-mRNAの3’ splice siteをsuppressするので、 より多くのintronがスキップされてオスと異なるmature mRNAが作られる。 これがさらにSxlを生成するので、ますますSxlが多くなる。(Suppressor)
オスはSxlがあまり無いため、このSxlのpre-mRNAのintronの一部がスキップされず含まれるようになり、その結果機能するタンパク質が合成されなくなる。
TRAのmRNAのintronにstop codonが含まれる部分があり、このintronの3’ splice siteをSxlはブロックする。 結果として、Sxlがあるとこのintronもspliceで消え去るのでTraが生成されるようになる。 一方Sxlが不足しているとブロックされないのでstop codonが含まれるようになり、 機能するタンパク質は合成されなくなる。(Suppressor)
TraはTra2と協力してDSXのweak 3’ splice siteのU2AFとの結合を助け、spliceされるようにして、最後のドメインがmaleとfemaleで違う部分になるよにする。(Enhancer)
最後のDsxの生成では、C-terminal domainだけが異なる事になる。female は短く、maleの方が長い。 このDsxの違いがmaleやfemaleの形成に必要な様々なgene発現に影響する。