『らせんを操るゲノム編集』から学ぶ:ゲノムワールド ⑤タンパク質の作り方を学ぼう

遺伝子からタンパク質へ
今回は、真核生物の細胞において、どのようにして遺伝子からタンパク質が合成されているかを学んでいきます。完成品となるタンパク質は、「アミノ酸」と呼ばれる物質から作られています。遺伝子は、各タンパク質のパーツとなるアミノ酸の順番に関する情報を持っていますが、実際に遺伝子からタンパク質が合成されるためには「転写」、「修飾」、「翻訳」という三つのフェーズが必要です。
図) DNA からタンパク質が合成される一連の流れ(Created with BioRender.com)
転写
転写は、DNAの塩基配列のうち、合成したいタンパク質に関する遺伝子の情報だけを取り出すフェーズです。なぜこのようなことをするかというと、DNAはあくまで膨大な情報の貯蔵庫のような存在であり、タンパク質を合成する度に貯蔵庫をまるごと利用するのは効率的ではないからです*1。ヒトであれば、一細胞当たり約20,000種類の遺伝子が存在していますが、実際はその細胞が担う機能や状況によって必要なタンパク質は異なり、全ての遺伝子を同時に利用する機会はありません。そのため、必要なタンパク質だけを効率よく合成できるDNAの鋳型のような存在が望まれます。 そこで、DNAは「 メッセンジャー RNA(mRNA)」と呼ばれる物質に、合成したいタンパク質に関連する遺伝子の塩基配列だけをコピーします*2。これが「転写」と呼ばれる過程です。ここで、転写に関して注意しておきたいことが二つあります。
一つ目は、mRNAの塩基配列はもとのDNAの塩基配列と全く同じではないということです。DNAは二重らせん構造を取っており、互いの鎖はお互いに相補的な配列になっていること、DNAを複製する際は二重らせん構造をほどき、各々の鎖に相補的な鎖を合成しますが、DNAからmRNAに転写される際も同様で、転写されるmRNAはもとのDNAと全く同じ塩基配列ではなく、これに一対一で対応した相補的な塩基配列となります。二つ目は、mRNAで使用される塩基の種類です。DNAではA,T,G,Cの4種類の塩基が用いられていることは何度か説明してきました。mRNAにおいては、DNAと同じくA,G,Cの3種類の塩基は用いられていますが、残り1種類は「ウラシル(U)」という別の種類の塩基が用いられています*3。つまり、mRNAはA,U,G,Cの4種類の塩基から構成されているということです。
修飾
DNAから転写されたmRNAは、次に「修飾」のフェーズに移ります。
修飾は、タンパク質を合成するにあたってmRNAをより使いやすくするためのいくつかの処理だと理解してください。修飾の中でも最も大がかりな処理の一つである「スプライシング」について説明します。スプライシングとは、mRNAから直接アミノ酸を指定する塩基配列だけを切り出して再構成するという処理です。遺伝子はタンパク質の合成を担う領域ですが、実は遺伝子中の塩基配列全てがアミノ酸の順番を直接指示しているわけではありません。図のように、遺伝子はアミノ酸の順番を直接指示する「エキソン」と呼ばれる塩基配列と、それ以外の「イントロン」と呼ばれる塩基配列が複雑に混ざって構成されています。イントロンはアミノ酸の順番を指示する働きを持っていないので、一見、非遺伝子領域と同じ存在のように思われるかもしれません。しかし、mRNAから必要なエキソンのみを取り出すスプライシングの手順を見ていくと、イントロンがタンパク質の合成において大きな意義を持っていることが分かります。スプライシングでは、mRNAから必要なエキソンのみが切り出されます。このとき、切り出されたエキソン同士は様々な組み合わせで再結合することが分かっています。
図では、エキソン1~5までの5種類のエキソンがあり、これをスプライシングによって切り出すことで(1,3,5)や(2,3,4)といった様々な組み合わせのmRNAになることが示されています。こうしたスプライシングを行うメリットは、もとは同じDNAの領域から転写されたmRNAであっても、スプライシングによってエキソンの組み合わせのバリエーションが広がるという点にあります。実際、ヒトの遺伝子は一細胞当たり約20,000種類存在しますが、スプライシングを行うことでこれらの遺伝子から切り出されるエキソンの組み合わせは約10万種類にも及ぶことが分かっています。これはイントロンによってエキソンが区切られているからこそ実現可能なことであるといえます。また、イントロンはmRNAを細胞内で運搬したり、この後で説明する「翻訳」をサポートしたりと様々なサポートを行っていることも分かっています。スプライシングなどの修飾を受けて成熟したmRNAは、細胞核を出て「リボソーム」と呼ばれるタンパク質の工場に移動し、最後の「翻訳」と呼ばれるフェーズに入ります。
翻訳
翻訳では、mRNA上の三つの塩基を一セットとして、三塩基ごとにアミノ酸を指定していきます。この三塩基のセットのことを「コドン」と呼びます。下記の表は「コドン表」といい、それぞれのコドンと対応するアミノ酸の一覧を示しています。縦の行がコドンのうちの一つ目の塩基を、横の列が二つ目の塩基を表しています。一つのコドンはA,G,C,Uの4種類の塩基を自由に使った三つ並びを一セットとする塩基配列ですから、コドンは全部で4×4×4=64種類が存在します。生体内で利用されるアミノ酸は全部で20種類あることが分かっており、64種類のコドンがそれぞれのアミノ酸を指定しています。また、64種類のコドンと各アミノ酸の対応関係は全ての生物で同一です。「翻訳とは、コドン表の通りにmRNAからアミノ酸が呼び出される過程である」と理解してください。
表)コドン表
セントラルドグマと遺伝子発現のプロセス
mRNAはタンパク質の工場となるリボソームにおいて、上記のコドン表に基づいてアミノ酸を順番に呼び出します。呼び出されたアミノ酸は既に呼び出されたアミノ酸に順番に繋げられ、タンパク質が合成されていきます。この過程が「翻訳」です。mRNAは最後まで翻訳されると、最終的に分解されて役目を終えます。以上が真核生物におけるタンパク質を合成する一連の流れです。このように、生物の遺伝情報であるゲノムが「DNA(遺伝子)→mRNA→タンパク質」という順で伝達され、タンパク質の合成に至るという考え方を「セントラルドグマ」といいます。また、セントラルドグマにおいて遺伝子がタンパク質に変換されることを「遺伝子が発現する」と表現します。「遺伝子が発現する」ということは、その遺伝子が持つ情報からタンパク質が合成されることを意味しているのです。
note
DNA のうちタンパク質の設計図となる部分を「遺伝子」と呼ぶ。遺伝子は「転写」→「修飾」→「翻訳」の三つのフェーズを経てタンパク質の合成を指示する。また、ゲノムが「DNA(遺伝子)G→ mRNA →タンパク質」という流れで伝達され、利用されるという考え方を「セントラルドグマ」と呼び、遺伝子がタンパク質に変換されることを「遺伝子が発現する」と表現する。
*1 DNA をそのまま利用するというのは、買い物をする度に銀行へお金を下ろしに行くようなことだと考えると、その非効率さが分かりやすいでしょう。
*2 mRNA は「RNA(リボ核酸)」と呼ばれる物質の一種です。RNA は DNA の仲間のようなものだと理解してください。なお、*9の例であれば、mRNA は貯金の一部を入れておく財布に相当します。
*3 一説によれば、これは進化の過程で DNA がUの代わりにTを用いるようになったことが原因であるとされています。