高等な真核生物では、一つのRNAは複数のsplicing方法があるのが普通。AlternativeSplicingは普通といえる。
人間においてh,exonの数は平均7〜8個で、一方、geneは平均3種類の異なる形にspliceされる。
ようするに電気泳動したRNAをラベル付けして撮影するような事がしたいのか。
DNAプローブで特定のgeneの特定の配列をターゲットにすると、alternative splicingが起きて無ければバンドは一つになる。 alternative splicingが起きていると複数に分かれる。
さて、splicingの途中経過を検出していた実験と比較して、mature mRNAだけをどうやって検出したらいいだろうか?
mRNAが核から核外に輸送されるのは、mature mRNAになってからだけ。 だからsplicing intermediateは核の中にしか存在しない。 そこで細胞質から取る、というのが考えられる。 さらに細胞にはintronが含まれてるRNAを破壊するpathwayがあるので、細胞質には無いというのはより確かな事といえる。
現代ではnorthern blotよりはRT-PCRを使う方が多くの上方が得られる。
簡単のため、exonが3つ(intronが2つ)あるケースを考えてみる。 RT-PCRを使ってalternative splicingを調べる手順を以下に示す。
ステップ3に関して。 このケースでは、それぞれのexonに相当する部分とhybridizeする3つのプライマーを作る。
一つはforward、2つはreverseのプライマーで、forwardのはexon1とhybridizeする。図中の2Rはexon2と、3Rはexon3とhybridizeする。
1Fと3Rを入れてPCRし、例えば適当な放射線ラベルなどでラベルづけして電気泳動すれば、splicingが1, 2, 3を含むケースと1, 3のみのケースで結果の長さが変わる。
また、1Fと2Rを加えてPCRすれば1, 2, 3なら一定量のバンドが見えるが、1, 3のケースならバンドは見られない。
PCRの効率などはシーケンスによって違ったりもするので、バンドの比率をそのままsplicingの比率とみなす事は出来ないが、 それでもどういうsplicingが多いかをある程度はつかむ事ができる。
こうして、組織によってsplicingのされ方が違ったりとか、状況によってsplicingの仕方が変わるようなものを調べる事ができる。
RNA-seqを使ってalternative splicingを調べる事も良く行われる。
high throughput sequencingはnext generation methodsとも言っていた。例としてはIllumina sequencing machineなどがあるとの事。
まず、サイズの情報が無い、single-end RNA-seq readsの場合を考える。
例えばexon1, exon2, exon3の3つがつながったmRNAがあると、RNA-seqを行えば、exon1, 2, 3のそれぞれのreadと、 さらにexon1と2にまたがったread, exon2と3にまたがったreadが得られる。 これでそれぞれのexonがつながって連続している事が保証され、どのようなmature mRNAになっているかが分かる。
一方、exon1とexon3で構成されるmature mRNAの場合、 exon2のreadが得られないだけでは無く、exon1と3にまたがったreadが得られる。
だがこの手法ではまたがった所のreadsが無いと、どちらのsplicingなのかをはっきり決める事は出来ない。
これにサイズによってより分けた結果サイズの付加情報があるsize-selected paired-end RNA-seq readsの場合、 exon1とexon3のreadsがあってさらにサイズがどのくらいかによって、 大きい場合は間にexon2があるケース、小さい場合はexon1と3が直接つながったケースという事が分かるので、 より確実にどちらのsplicingかが判断できる。
と言っていたがいまいち良く分からない。ただ、もっと複雑なgene、それこそexonが50個とかある場合などもあるとの事で、 こうしたサイズ情報も合わせて考える方が構造をより良く理解しやすいのかもしれない。 そういうものは、数百のオーダーのalternative splicingがある場合もあるとか。
Metazoan organizmsとは多細胞生物の動物(植物でない)のうち原生動物を除いたものらしい。>後生動物 - Wikipedia
ここまでAlternative Splicingの機構を見てきたので、次に、それがどのくらい重要なのか、をどのくらい使われているかを見ていく事で考えてみる。
項目 | 人間 | ショウジョウバエ |
---|---|---|
ゲノム中でタンパク質をコーディングしているgenes | 22180個 | 13937個 |
2個以上のisoformsがあるgeneの割合 | 88% | 45% |
geneあたりの平均isoform数 | 3.4個 | 1.9個 |
全isoform数 | 215170 | 29173 |
これらの数字もまだまだ研究中で日々新しいデータが更新されている領域らしい。
なんで人間の平均isoform数が3.4なのにgeneの数と全isoform数の間は10倍近い差があるんだろう?
生物種によりこのように大きく違う。また、人間にはAlternative Splicingはすごく大きなインパクトのある重要な機能といえる。
どんな種類のalternative splicingが存在するか?と考えると、以下のような代表的なものが考えられる。
あるsplicingが全てのexonを含み、もうひとつのsplicingがどれかのexonをスキップすれば、2つの生成結果は異なるものとなり、 Alternative Splicingが起きたといえる。
例えば図の3をスキップするケースを考えると、 5’側のsplice siteが別のものが使われるケースと、3’側のsplice siteが別のものが使われるケースの2つが考えられる。 regulationを考える時にはどちらなのかが重要になってくる。
例えば前述の図と同じexonがある時に、2と3の間のintronがそのまま残るかカットされるか、のようなalternative spliceが考えられる。
特定のexon、例えばexon2が、それぞれのsplicingで別々のexon2.1, exon2.2, exon2.3という感じの亜種にバラけるケース。 どのsplicingでも2番目のexonにそれぞれバラバラのexonが含まれるようなもの。
これは特定のドメインを差し替えるような時に使われる。
splicingの最初のexonが異なったり、最後のexonが異なるようなケース。
最初のexonが異なればその次も異なるexonが使われるかもしれないので、生成されるタンパク質のN-末端側が異なるタンパク質ができる事になる。
逆に最後のexonが異なるケースだと、その次も別のexonにつながるようにもできる事から、C末端側が異なるタンパク質ができる事になる。
これはタンパク質の膜のbinding domainなどが対象となって、特定の細胞では膜結合タンパク質に、 別の細胞では細胞質にとけるタンパク質になる、のように特定のドメインを差し替えるような時に使われる仕組み。
ここではAlternative Splicingが実際に生物のどんな所で使われているかを見ていく。
ある生物種が形成の段階で異なるsplicingをする例として、α-troponin Tとβ-troponin Tの例を見ていく。
troponin T proteinは、成人になると生成されるアルファと、胎児の時に生成されるベータの2つの型があり、 これはalternative splicingで生成しわけられている。
adult formであるアルファはexon3を含み、fetal formであるベータはexon 4を含む。それ以外は同一。 こうして2つのisoformのタンパク質ができる。 troponin Tの場合、アルファとベータで異なるのはわずか14AAだけ。
アルファとベータでは、筋肉のタンパク質であるtropomyosinとの相互作用の仕方が異なる。 これは筋肉の収縮の仕方が成人と胎児で異なる結果となる。
吸血コウモリ(vampire bats)は他の恒温動物の血液を餌とする。 そこでいろいろな生物種で見られるthermoreceptorを、温かい血液を検知するのに最適化するべくalternative splicingを使用している。
この対象とするgeneはsensory ion channelで、通常の生物では危険なレベルの高温を検出するのに使われているもので、 具体的には43度以上あたりから反応する。 これがalternative splicingで30度あたりから37度あたりまでの温度を検出するのに使われるように調整されている。
対象となるタンパク質はTRPV1と呼ばれるタンパク質。通常の生物では一種類だが、 吸血コウモリは2つのisoformのタンパク質を持つ。 そして鼻の所にこの温度を検出するセンサーを持つ。
吸血コウモリと似たコウモリとして、fruite batというものがいる。 こちらは血は吸わないのでこのセンサーは不要。
吸血コウモリはTRPV1のshort formとlong formを持ち、 short formはlong formのC末端を63AAほど削ったものになっている。
fruit batはほとんどlong formだけを持つ。
吸血コウモリは2つのformを持つだけでは無く、このformを場所により生成しわけていて、 鼻のあたりの末梢神経では4:6程度の比率で、別の場所ではこれがほとんどlong formのみとなっている。
short formとlong formの違いは、exon 14, 14A, 15のあたりに見られて、 long formでは14, 15がsplicingでつながるが、short formでは14, 14A, 15と間に14Aが挟まり、 この14Aはコーディングregionに含まれて、この中にstop codonがある。
なお、モグラもこの吸血コウモリと似たsplicingを行う事が知られている。
犬や牛も似たexon 14Aがあるが、これらの中にはstopコドンが入っていない。
ネズミや人間などのその他の生物では14Aに相当するexonは無く、14から15が直接つながる。