メタバーコーディングとは、DNA配列情報を用いてそのDNAがどの生物種に由来するのかを判別する手法です。

自然環境中には、水・土壌・空気などを介して、さまざまな生物由来のDNA(環境DNA)が存在しています。

この環境DNAに対してメタバーコーディング解析を行うことで、その場所にどのような生物が生息・存在しているのかを、比較的簡便かつ網羅的に把握することが可能になります。

近年、この技術は急速に発展し、基礎研究にとどまらず、環境調査・生物多様性評価・モニタリング業務など、実務レベルでの利用も進んできました。

一方で、次世代シーケンサーをはじめとする解析技術の背景はやや複雑で、初学者にとって理解のハードルが高い点もあります。

本記事では、環境DNAメタバーコーディングの考え方と、次世代シーケンサーを用いた解析の基本原理について、できるだけ平易に解説します。

環境DNAとメタバーコーディング

環境DNAとは

環境DNAとは、水・土壌・底質・空気など、環境中に存在するDNA全体を指します。

これには、魚類や哺乳類などの大型生物だけでなく、バクテリアや真菌などの微生物由来DNAも含まれます。

分野によって定義に多少の違いはありますが、環境DNA学会では 微生物を含む、すべての生物由来DNAを環境DNAとして扱っています。

生物が排出する粘液、フン、死骸、細胞片などが環境中に拡散・残存することで、直接生物を捕獲しなくても存在情報を取得できる点が、環境DNA解析の大きな特徴です。

メタバーコーディングとは

メタバーコーディングとは、DNA配列を「バーコード」のように利用して、生物種を識別する技術です。

すべての生物は共通の祖先から進化してきたため、生命維持に必須な遺伝子の多くは、生物種間で共通しています。

一方で、そうした遺伝子の中にも、種ごとにわずかずつ異なる配列領域が存在します。

メタバーコーディングでは、この「広く共通しているが、種ごとに少しずつ異なるDNA領域」を解析対象とし、配列の違いから生物種を推定します。

単一の生物を対象とするDNAバーコーディングに対し、多数の生物が混在するサンプルを一括で解析する点が、メタバーコーディングの特徴です。

メタバーコーディング解析の原理

メタバーコーディング解析では、環境DNA中に含まれる多数のDNAのうち、生物種間で共通しつつ、識別に十分な違いを持つ領域を選んで解析します。

その基本的な流れは以下の通りです。

  1. 環境サンプル(水・土壌など)からDNAを抽出
  2. 特定のDNA領域をPCRで増幅
  3. 次世代シーケンサーで配列を大量に解読
  4. 得られた配列を参照データベースと照合
  5. 生物種の推定・組成解析

解析対象の絞り込み (PCR法)

環境DNAには無数のDNA断片が含まれるため、解析対象となるDNA領域をあらかじめ限定する必要があります

この工程で用いられるのがPCR(Polymerase Chain Reaction)法です。

PCRとは、特定のDNA領域だけを選択的にコピーし、解析に十分な量まで増幅する技術です。

PCRを理解するうえで重要なのがプライマーの存在です。

プライマーとは、目的とするDNA領域の両端に結合する短いDNA配列で、 「どの領域を増幅するか」を決定します。

環境DNAメタバーコーディングでは、多くの生物に共通して結合できるよう設計されたユニバーサルプライマーが用いられます。

よく利用されるDNA領域とプライマー

環境DNAメタバーコーディングで頻繁に利用されるDNA領域を以下に示します。 特に脊椎動物を対象とした解析では、12S rRNA領域が広く使われています。

分類群領域名プライマー名
魚類12S rRNAMiFish
鳥類12S rRNAMiBird
甲殻類16S rRNAMiDeca
哺乳類12S rRNAMiMammal
ウナギ類12S rRNAMiEel
海洋生物 (哺乳類+無脊椎動物)12S / 16S rRNAMarVer 1 / 3

rRNA(リボソーマルRNA)遺伝子は、タンパク質合成に必須の遺伝子であり、この機能が失われると生物は生存できません。

そのため、rRNA遺伝子の重要な部位は進化的に保存されやすく、一方で周辺には種判別に利用できる変異が存在します。

12S rRNAはミトコンドリアDNA上に存在する遺伝子で、コピー数が多く、環境DNAから検出しやすいという利点があります。

次世代シーケンサーによるメタバーコーディング

次世代シーケンサーとは、DNA配列を高速かつ並列的に大量解読するための装置です。

従来のサンガー法と比べ、(1)同時に数十万〜数百万配列を取得可能、(2)混合サンプルの解析に適しているといった特徴があります。

ナノテクノロジーと情報解析技術の進歩により、現在では環境DNAメタバーコーディングに必要なデータ量を、比較的短時間・低コストで取得できるようになっています。

環境DNAメタバーコーディングの費用感

環境DNAを用いたメタバーコーディング解析の費用は、1検体あたりおおよそ3〜4万円程度であることが一般的です。

(1)対象分類群、(2)解析深度、(3)検体数などによって価格は変動し、複数検体をまとめて依頼することで単価が下がる場合もあります。

詳細は各分析会社に確認するのが確実です。

おわりに

本記事では、環境DNAメタバーコーディングの基本的な考え方から、PCR・次世代シーケンサーを用いた解析の流れまでを概説しました。

個々の技術要素は複雑に見えますが、「どのDNAを選び、増やし、読み取り、照合するのか」という流れを押さえることで、全体像は理解しやすくなります。

今後、環境調査や生物多様性評価に携わるうえでの基礎知識として、本記事が参考になれば幸いです。