メンフィスにて

主に生命科学と社会について考える

トポロジカルな染色体構造を壊す変異ががん遺伝子の発現を引き起こす(これもエンハンサー)

エンハンサーの話題をもう一つ。

既に”新たなエンハンサーの出現ががん遺伝子の活性化に関与している”ことを示した論文を紹介した。これは約1年半前の仕事だったが、同じT細胞白血病で同じがん遺伝子がさらに新しい機構によって活性化されたとする論文が先月のScienceに出てきた。分類の仕方によるががん遺伝子活性化の6番目の機構ということになる。

二つの巾着構造

f:id:akirainoue52:20160520012336j:plain

染色体はしばしば結び目のような構造を作る。これはCTCFとコヘーシン(cohesin)によって形作られる巾着型の構造(loop)を指す。こうした構造には二つのクラスがある。一つはエンハンサー/プロモーターの近接を引き起こすものだ。本来のプロモーターとエンハンサーがDNA上である程度離れていても、コヘーシンによって両者のDNA領域が束ねられることによって近接するようにになり相互作用できる状態になる(図左)。しかしこのような遺伝子+調節領域の単位はさらに大きなもう一つの巾着型構造(図右)に収められている。こちらの構造を作るにはCTCFとコヘーシンの両方が必要である。このような大きな巾着のことをinsulated neighborhoods (INs)と呼んでいる。このINsの役割は何か? この構造は染色体上の活性化された場所と不活化された場所を明確に隔離(insulation)しているのだ。がん遺伝子TAL1は、本来正常T細胞では転写的に不活性化されているINsに隔離されている。今回の論文はこの巾着型構造が破壊されることによってTAL1の発現が起こり、最終的にT細胞白血病を招来するという話だ。

この仕事はボストンのWhitehead InstituteのRichard Youngのグループによって行われた。著者の中にエピジェネティクスの大家、Rudolph Jaenischが入っている。CTCFの関与する染色体の構造を作るには、DNAメチレーションが必要であることが既に知られており、エピジェネティックな現象の一つとして捉えることができる。

もともとコヘーシンはその名の通り姉妹染色分体のコヘージョン(sister-chromatid cohesion、SCC)を作る分子群として発見された。(平野達也はこの分野で先駆的な業績をあげてきた研究者の一人だ。)S期に複製された姉妹染色分体をM期まで束ねておくという役割がある。しかしコヘーシンはSCCのみならず細胞分裂や細胞周期、さらには遺伝子発現調節にも関与していることも知られていた。コヘーシンといっても一つの分子ではなく四つないし五つのタンパクからなるヘテロマーである。一方CTCFはヘモグロブリンの発現調節の機構を地道に研究してきたGary Felsenfeld (NIH)によって発見された単一タンパクだ。いわゆるクロマティンバリア機能とエンハンサー/プロモーター遮断機能はCTCFの機能として比較的初期に確立された。(当初地味な存在であったFelsenfeldの仕事は現在末広がりになっている。)

INを作るにはCTCFとコヘーシンの両方が必要

本題から少し外れるが、CTCFとコヘーシンの染色体上の局在について振り返ってみたい。CTCFやコヘーシンがゲノム上のどこに存在するかは重要な情報である。ChIP-seq法を用いたCTCFの局在を網羅的に調べた論文が2,007年に発表された。そこではCTCFの結合するコンセンサス配列はCCGCGNGGNGGCAGと決定された。同じくコヘーシンの局在は2,008年に二つのグループからほぼ同時に発表された。この仕事は主にSCCがどこに作られるかという疑問に答えるべくおこなわれたのだと思う。しかし驚くべきことに、このCTCFとコヘーシンの局在しているDNAのコンセンサス配列はほぼ同一であることがわかったのだ。さらに両者の機能的スペクトルは相当程度に重なっていた。

コヘーシンしか存在しない部位でのコヘーシンの機能については当時は不明であった。遺伝子発現におけるコヘーシンの役割はES細胞における多分化能(pluripotency)に必要な遺伝子の発現機構を追求する中で発見されたのだ。この仕事でKageyらはOct4の発現に必要な遺伝子を特定した。その結果、当初想定しいていた転写メディエーターであるMed1の他にコヘーシン(Smc1, Smc3, Stag2)そのものや、コヘーシンローディング因子(Nipbl)も見出された。しかし興味深いことにこうした染色体部位にはCTCF結合配列は存在していなかったのだ。さらにKageyらはコヘーシンが各遺伝子のプロモーターが当該エンハンサーと空間的に接近した状態を保つのに必要であることを示した。

異なる染色体領域が空間的に近傍にあることを示すために3Cという手法が用いられてきた。簡単にいうと、細胞をホルムアルデヒドで固定した上でゲノムDNAを制限酵素で切断した後、クロマチンIPで当該タンパクとDNAの複合体を回収してくる。コヘーシンのようなDNAを束ねるような機能をもつタンパクを落としてくると、染色体上の飛び離れた場所のDNA断片が同時に回収されてくるわけだ。そこで回収されたタンパク/DNA複合体に含まれるDNA断端同士をリガーゼによってつなぎ合わせてやる。そうすると本来離れた場所に存在するDNA同士の合いの子分子ができる。これを配列決定してやれば染色体上のどことどこが束ねられているかがわかるという寸法だ。現在はこのプロトタイプの方法のさらに進化した方法が用いられている。(やや蛇足ながら、こうした手法がコンスタントに上手くいく〔英語では"work"の語を使う〕ためには上質の抗体を用いることが不可欠である。良い抗体は常に発見の元だ。)

このような手法により、上に述べたコヘーシンによるエンハンサー/プロモーターの巾着や、CTCTとコヘーシンによるINの形成は広く受け入れられるようになったのだ。

T細胞白血病でのINの破壊

さて本題に戻る。このScienceの論文の最初のデータは、この3Cの進化型(Hi-C asssay)を用いてJurkat細胞におけるINsのあり方を網羅的に調べたのものだ。これによって既にJurkat細胞で知られているがん遺伝子の発現状況と、染色体上のIN環境との対応関係を明らかにすることができた。問題のがん遺伝子TAL1はCTCF/コヘーシンで作られる”大きな”巾着の中に収められていて、この内部はH3K27acのピークで埋められている。だからJurkatではTAL1は活性化されたINの内部にある。が、この活性化されたエンハンサーは新たに挿入された12塩基対の挿入によるMYBタンパクの結合の結果で、本来この内部は転写的には”不活性な”領域のはずである。(このストーリーはMansour論文を参照されたい。)実際正常T細胞ではこうしたH3K27acシグナルはこの領域には見られない(このデータはとても重要だがsupplementary dataで示されている)。

Jurkat細胞でのTAL1遺伝子の周囲のINは明らかとなった。ところが臨床的に見られる多くの急性T細胞白血病ではこのINが破壊されている。INの形成には二つのCTCF結合配列が必要である。こうしたケースではこのうち片方のCTCF結合配列を含むDNA領域が欠失している。これらの欠失領域には二つのクラスが見出された。一つはTAL1のプロモーター配列を含むそれ以遠の欠失で、この場合は上流にあるSTIL遺伝子コード領域の欠失を伴っている。ただしこの場合もSTIL遺伝子のプロモーターは残っていてこれがTAL1の転写に使われている。このようなゲノムDNAの欠失は既に四半世紀前に記載されている。

もう一つ(これが新発見なのだが)はTAL1プロモーターが残っている場合である。この場合はTAL1を抱えるINが破壊されている。系統の異なる細胞であるHEK−293TではこのINは保たれているがTAL1遺伝子の発現は見られない(これは正常T細胞と同じ)。こうしたいわばノーマルなINを作っている細胞で、”例のごとく”CRISPR/Cas9を用いてCTCF結合配列を人為的に欠失させてやるような実験を行った。結果は予想通りで、INが破壊されると同時にTAL1の発現が約2倍上昇した。正常T細胞で同様の実験を行ってもINの破壊とTAL1の発現上昇が起こった。したがって正常T細胞ではCTCFによりTAL1を封じ込めるようにINが形成されていて、結果TAL1は活性のあるエンハンサーから隔離されている。INが破壊されると外のエンハンサーの影響を受けてTAL1の発現が促される。TAL1の発現を促しているエンハンサーは、H3K27acの分布からみて約150 kb上流のCMPK1の近傍のものらしい。実際にはTAL1プロモーターを含む欠失(四半世紀に前に発見された一番目のクラス)でも同じCTCF配列が飛んでいるのでINは壊れているはずだが、これについては言及されていない。

論文では同じT細胞白血病で同様の機構によるがん遺伝子の例としてLMO2遺伝子のデータを示している。さらに論文の残りのスペースで他のがんでのIN破壊によるがん遺伝子の発現の例を挙げている。これらはもっぱらコンピュータ上の解析であるが。こうしたデータから予想されることは、様々ながん細胞で高頻度に見られるゲノム上の欠失の多くは、INsの破壊による異常なエンハンサー/プロモーターの近接によるがん遺伝子活性化を引き起こしている可能性がある。

多様なTAL1活性化機構

さて私は前述のように、がん細胞におけるエンハンサーの生成に関する記事を書いた。そこではTAL1遺伝子の上流に短い配列が挿入され、この配列に転写因子MYBが結合する。このMYBの結合がスーパーエンハンサーの出現を引き起こし、結果TAL1の発現に至る。

一方今回報告された機構は逆に欠失によるものであり、その結果隣の区画のエンハンサーの影響を受けることでTAL1が発現するに至る。これらを総合すると、T細胞白血病におけるエンハンサー/プロモーターの再配置からみたTAL1の活性化の機構には、計3通り(MYB配列の出現、二通りのCTCF配列の欠失)があることがわかる。がん細胞では、自らの増殖に有利なゲノム変化はポジティブに選択される。このため理屈で考えれらる活性化の仕方がかなり後になって臨床がんで見出されることがしばしばある。しかしがんの種類によってゲノム変化の仕方(例えば増幅や転座などのことだが)が異なっている。この違いの理由についてはこれからの課題である。

データベースからアイデアを作る

CTCF結合配列の欠失によるがん遺伝子の活性化については理論的にはかなり以前から可能性が考えられていた。しかしこれが日の目をみた背景にはomicsがある。次世代シークエンシングとデータ処理の組み合わせだ。事実今回紹介した論文でも各局面でデータベース上の解析を行っている。何回か述べたと思うが、自ら次世代シークエンシングをしなくとも、データベース上の解析から新たな”疑問”や”仮説”を得ることは十分可能である。