FishCARD: 効果的なメタバーコーディングのためのカリフォルニア海流域に特異的な魚類の12sのデータベース

FishCARD: Fish 12S California Current Specific Reference Database for Enhanced Metabarcoding Efforts

簡単な要約

  • カリフォルニア海域ではMiFishで使う領域のデータが不足していた。
  • 現状の459種に加えて、本研究で258種の配列データを収集した。
  • 新規配列を加えたデータベースFishCARDは、既存データで解析した時と比較して、科レベル、種レベルで同定される配列数が増加した。
  • 解析時に得られた24.5%の魚類と分類されなかったreadの多くはシアノバクテリアなどの細菌類、珪藻類、藻類を含む真核生物の16s rRNA領域由来の配列であった。
  • 非特異的な配列は評価を制限する要因になるが、対象地域の配列データを集めることは多様性評価を向上させることができる。

感想

全体を内容を簡単に読んでみました。狙ってやったことかどうかわかりませんが、170bp前後のMiFishに対して、片側で300bpも読むことができるカートリッジでシーケンスしています。本文中にあった非特異な16s rRNA由来の増幅というのは、多分いつも2nd後のe-gelの精製時にみられる長鎖のバンドも若干含んでると思います。あれ、別領域の配列だったのですね。湖沼や沼などの藻類、珪藻が多い水域でのMiFishによるメタバーコーディングはちょっと注意が必要そうです。解析で出てきたAnacapa tool kitはデータ分析とデータベース作りの時に使ってみるのは面白そうだと思いました。

以下、簡単な解説です。参考程度に読んでみてください。

内容

アブストラクト

メタバーコーディングは分子生態学において強力な技術であるが、関心の高い分類群や領域によってデータベースの効率は依存する。

カリフォルニア海域も同様であったため、MiFish primerの領域を対象に612種の配列を決定した。これにより、Genbankに登録されていたカリフォルニア海域の魚類459種に新たに258種の配列が登録された。これらが登録されているFishCARDは、今までの調査で確認されている82.7%の魚類をカバーしている。

1L×3地点の環境DNAサンプルを分析してみたところ、カリフォルニア海域に生息する15の固有分類群と得られた全体のリードの21.8%を特定することができた。

ただし、MiFishプライマーによって生成された配列の半分は、脊椎動物以外の16S rRNA由来であった。

非特異的な増幅があるものの、FishCARDは現在のカリフォルニアの大規模海洋生態系における海洋メタバーコーディングの取り組みの効果を高めるための重要な遺伝資源を提供する。

メソッド

※リファレンス作りの工程は飛ばします。

採水・ろ過

  • 3地点で各1L
  • Sterivex 0.22μmを使ってろ過
  • -20℃で保存

抽出

  • Spens et al. (2017)に従ってDNseasy Blood and tissue kitで抽出

シーケンシング

  • Curd et al. (2019) に従ってライブラリ調整
  • Illumina MiSeq PE 2x300で配列決定

解析

  • Anacapa Toolkit(Curd et al.2019) を使用 データベースの比較 CRUX-12S vs FishCARD
  • CRUX-12S: CRUXという方法で構成した既存配列データベース
  • FishCARD: 今回新規に配列を決定したデータを含めたデーベース

リザルト

※リファレンス作りの結果は飛ばします。

eDNA metabarcoding

  • 3サンプルから330887readを生成
  • 1readしか得られなかった固有配列(=singletons)を除去すると341の固有配列を取得(除去前の固有配列は2152種類)
  • フォワード側341種類、リバース側211種類の固有配列をマージ
  • フォワード側のみの固有配列が123種類、リバース側のみの固有配列が7種類あった。

Unassigned MiFish 12S ASVs

  • Anacapa Toolkitは49.6%(169/341種類)の固有配列で構成される24.5%のreadがどの魚類であるかを同定できなかった。
  • 16/341の固有配列はフォワード側のみ、153はマージされた配列
  • 未同定配列をBLAST検索すると、97.4%(160/169)が海洋原核生物と真核生物の16s rRNA領域の配列に割り当てられた。

Reference Database Comparisons

非特異的な配列を覗いた172の固有配列を用いて比較すると

科レベルの同定種レベルの同定
CRUX-12S89.5%(154/172)84.3%(145/172)
FishCARD100%(172/172)88.4%(152/172)

フォワード側とリバース側をマージできた配列58本のみを用いると

科レベルの同定種レベルの同定
CRUX-12S94.8%(55/58)87.9%(51/58)
FishCARD100%(58/58)93.1%(54/58)

という形で、新たに配列を追加したデータベースの方が種を同定することができた固有配列の数が増加した。

ディスカッション

  • 単独での使用、既存の参照データベースと組み合わせて使用​​する場合でも、FishCARDはカリフォルニアの現在の沿岸水域からの環境DNAメタバーコーディングの同定精度を劇的に向上させる。
  • 得られた固有配列のほぼ半分は非特異的な配列で、海洋におけるショットガンメタゲノム研究に由来する未培養細菌の16s rRNAであった。
  • 今までのカリフォルニア海域の魚類環境DNAメタバーコーディングは種レベルの同定が不十分で、本来生息しないような近縁種への同定が多く報告されていた。
  • リファレンスを充実させれば、分子同定能力が向上すると仮定するのは理論的だが、配列の共有などのにより種まで同定できないようなトレードオフが生じることがある。
  • 今回はca.176bpの領域に対して300bpのペアエンドシーケンスを行ったが、かなりマージされないようなシングルエンドリードが得られた。この利用として、Illuminaシーケンサーの低品質化するリバースシーケンス生成の影響が大きい。このことを加味すると、シングルエンドリードを評価に含めるかは慎重な判断が必要である。
  • 今後の魚類環境DNAメタバーコーディングの改善案として、MiFish, Teleost, Elasasmobranchなどの12s rRNA領域のプライマーも重要であるが、COIと16sなどの複数領域を同時に利用した場合単独プライマーでの評価よりも分子同定精度が向上したことも報告されているので重要である。

以上です。

使用した画像はジャーナルのCC BYに従い、記事で紹介したオープンアクセスの論文中の画像または、自身で作成したものを使用しています。