MitoFish と MiFish パイプライン:環境DNAメタバーコーディングのための分析パイプラインを備えた魚類のミトコンドリアゲノムデータベース

MitoFish and MiFish pipeline: a mitochondrial genome database of fish with an analysis pipeline for environmental DNA metabarcoding

MitoAnnotator を実装している MitoFish の機能的アップデートに関する報告論文です。中心的な内容として、魚類ミトコンドリアを対象とした環境DNA分析のための MiFish パイプラインの実装が記載されています。

この解析パイプラインは、データを処理するうえで、上図 A のように複数のソフトウェアを組み合わせて構築されています。

使い方は簡単です。サイト内の説明に沿って進めていきましょう。

サムネイル画像のGet started nowボタンを押すと、この画面に移ります。

次世代シークエンサーから出力されたfastq.gzもしくはfastqファイルを持っている方は、ドラッグ&ドロップで赤枠のところにポイっと入れてください。

もしfastqファイルを持っていない方は、オレンジ枠のfastq.gzファイルをそれぞれダウンロードしてから、同様に赤枠の部分にポイっと入れてください。

ポイっと入れたらUploadしましょう。

アップロードが完了すると、このような画面に移行します。下に変更可能な設定値がいくつかあります。

  • Filter reads by length: フィルタリングする配列長と、除去するプライマー配列を設定します
  • Remove primer: プライマー配列を変更する部分だと思いますが、現時点では変更できないようです

  • Download statistics report: 解析が終わった後にレポートを出力するかどうか
  • Minimum read size for filtering: 出力の際の最低リード数をどうするか
  • Identity threshold for clustering: 1塩基・2塩基違いの配列が混在する中で、代表配列としてまとめる際に何塩基違いまでを許容するか
  • Run BLAST (Identity): MiSeq で解読された配列について、フィルタリング後に残った代表配列との相同性検索を行う際に、トップヒットの一致率を何%まで許容するか(など)

基本的に設定は変えなくてよいと思います。では、下の Run ボタンを押して解析を開始しましょう。

解析を開始すると、現在どこまで処理が進んでいるのか確認できます。

すべての処理工程が終われば、Show Resultsで解析結果を確認できます。

オオクチユゴイやオオウナギなどが検出されているので、このサンプルは沖縄でしょうか。

Representative sequence は、その種であると判断する根拠となった代表配列のことです。右上のDownload Resultsで、結果をまとめてダウンロードできます。

ここでは Web の MiFish pipeline を紹介しましたが、このパイプラインを使わなくても MiFish を用いたメタバーコーディング解析は可能です。論文とデモデータを用いた解説 をこちらで行っています。勉強しながら書いているので、解釈に誤りがあるかもしれませんが、一度目を通してもらえると知見が広まると思います。

画像はジャーナルの CC BY に従う形で、記事で紹介したオープンアクセスの論文中の画像、または自身で作成したものを使用しています。