最先端のゲノムサービスおよびソリューション

de novo シーケンス

サービスの概要
Novogene のデータ
お問い合わせ

de novo シーケンスと de novo アセンブリde novo シーケンスでは、種の最初のゲノムマップが作成され、系統発生的研究、種多様性の解析、特定の形質と遺伝子マーカーのマッピング、およびその他のゲノミクス研究に有益な参照シーケンスを提供します

Novogene はより迅速かつ低価格になりつつある de novo シーケンスの最前線にいます。Novogene の創立者であるRuiqiang Li 博士はゲノム研究では第一人者で、ゲノムアセンブリの SOAPdenovo ソフトウェア・パッケージを最初に開発しました。Li 博士と Novogene チームは今までにないゲノムシーケンスに関する数多くの重要な出版物に貢献し、Novogene は、お客様固有のプロジェクトに必要な高レベルの専門知識を提供できます。

10 PacBio Sequel システム以外に 、 ロングレンジのシーケンスと 7 倍のスループットを提供することで、Novogene は世界最大規模の PacBio SMRT シーケンスプロバイダーとなりました。Novogene は、PacBio Sequel、イルミナ HiSeq、10X Genomics Chromiumを含む様々なプラットフォームを用いて、de novo シーケンスサービスを提供します。各プロジェクトで、Novegene の科学者は、対象のゲノムについて最も総合的な de novo アセンブリを実現するために、ショートリードとロングレンジのシーケンス情報の最適な組合せを利用して最高のシーケンス条件を設計します。

プロジェクトの種類

単一ゲノム

単一ゲノムは、配列の繰り返しが少ない一倍体ゲノム(50% 未満)、またはほとんどの哺乳類、鳥類、栽培作物のようなヘテロ接合性の割合が少ない二倍体ゲノム(0.5% 未満)を指します。

複合ゲノム

複合ゲノムは二倍体または 倍数体 ゲノムで配列の繰り返しが多いゲノム(50% 超)あるいは多くの種の植物、水生動物、昆虫のようなヘテロ接合性の割合が高いゲノム(0.5% 超)を指します。
  • ヘテロ接合性が中程度のゲノム(ニ倍体)
  • ヘテロ接合性が高いゲノム(ニ倍体)
  • 配列の繰り返しが多い ゲノム(ニ倍体)

Novogene の強み

  • 経験が豊富:Novogene では、主要なde novo ゲノムシーケンスのプロジェクトが完了後、得られたデータは一流学会誌で発表されました。
  • シーケンスの最大能力:Novogene は、世界最大級のイルミナと PacBio シーケンスによって、高品質のデータ、迅速な納期、低価格を提供することができます。
  • バイオインフォマティクスの専門知識:Novogeneでは、複雑なゲノムアセンブリに対して、SOAPdenovoとNovoHeterのような、クラス最高または自社開発のソフトウェアを使用します。
  • 多様性のある戦略:イルミナHiSeq、PacBio Sequel、10X Genomics Chromium を含む様々なプラットフォームからシーケンス結果を組み込むことで、 それぞれ一意のゲノムに合った最高のアセンブリソリューション提供します。

プロジェクトのワークフロー

de novo シーケンスサービスに関するプロジェクトのワークフロー

シーケンス条件とデータ品質の保証


 ゲノムサーベイ解析
プラットフォームイルミナ HiSeq
シーケンスライブラリ350 bp を挿入
シーケンス条件PE150
 単一ゲノム de novo シーケンス複合ゲノム de novo シーケンス
アセンブリ戦略 I
イルミナのショートリードベースのアセンブリ
シーケンスライブラリ250 bp / 450 bp /
2 Kb / 5 Kb / 10 Kb 挿入
250 bp / 350 bp / 450 bp /
2 Kb / 5 Kb / 10 Kb / 20 Kb 挿入
ソフトウェアSOAPdenovoIINOVOheter
データ品質保証哺乳類(翼手目以外)または鳥類のゲノム:
コンティグ N50 ≥ 40 Kb
スカフォールド N50 ≥ 4 Mb

その他のゲノム:
コンティグ N50 ≥ 30 Kb
スカフォールド N50 ≥ 1 Mb
コンティグ N50 ≥ 20 Kb
スカフォールド N50 ≥ 500 Kb
アセンブリ戦略 II (草案参照のゲノム用)
PacBio ロングリードデータを用いたイルミナのショートリードベースのアセンブリとギャップフィリング
データ品質保証哺乳類(翼手目以外)または鳥類のゲノム:
コンティグ N50 ≥ 80 Kb 
スカフォールド N50 ≥ 4 Mb  

その他のゲノム:
コンティグ N50 ≥ 60 Kb  
スカフォールド N50 ≥ 1 Mb
コンティグ N50 ≥ 40 Kb
スカフォールド N50 ≥ 500 Kb
アセンブリ戦略 III
ハイブリッドアセンブリ組み込みのイルミナショートリードデータ、PacBio Sequel ロングリードデータ、そして 10X Genomics に連鎖したリードデータ
データ品質保証コンティグ N50 ≥ 500 Kb
スカフォールド N50 ≥ 1 Mb
コンティグ N50 ≥ 200 Kb
スカフォールド N50 ≥ 1 Mb
アセンブリ戦略 IV
高品質 de novo アセンブリ(70X PacBio Sequel リード)
データ品質保証コンティグ N50 ≥ 1 Mbコンティグ N50 ≥ 200 Mb
アセンブリ戦略 V(推奨)
スーパースカフォールドと染色体スケール de novo アセンブリ組み込みの PacBio Sequel リードと、10X Genomics / BioNano / Chicago / Hi-C
データ品質保証コンティグ N50 ≥ 1 Kb
スカフォールド N50 ≥ 3 Mb
コンティグ N50 ≥ 500 Kb
スカフォールド N50 ≥ 1 Mb

de novo シーケンスサービスに関するプロジェクトのワークフロー
図。アセンブリ戦略 V のイラスト:スーパースカフォールドと染色体スケール de novo アセンブリ
組み込みの PacBio Sequel リードと、10X Genomics / BioNano / Chicago / Hi-C。


カスタマイズされたサービスも、ご要望に応じてご利用いただけます。詳細はお問い合わせください。

サンプル条件

  • サーベイ用の DNA 量:≥ 10 µg
  • ゲノム de novo  シーケンスの 1 ライブラリごとの DNA 量:≥ 2 µg(イルミナシーケンス用)、 > 20 µg (PacBio シーケンス用)
  • DNA 濃度:≥ 50 ng(イルミナシーケンス用)、> 80 ng/µL(PacBio シーケンス用)
  • 純度:OD260/280 = 1.8 - 2.0 (分解または RNA のコンタミがないこと)
*DNA の定量は Qubit 2.0 で行う対象のゲノムに必要な総 DNA 量については、Novogene のチームまでお問い合わせください。

解析パイプライン

de novo シーケンスサービスの解析パイプライン

以下の研究は、Novogene のde novo シーケンスと de novo アセンブリを利用しました。

Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement)
Nature Biotechnology 33:531 (2015)

この研究では、Novogene の de novo 全ゲノムシーケンスと RNA シーケンステクノロジーを用いて、異質四倍体の綿の遺伝子配列を得ました。Novogene は、以前の研究で他の異質四倍体種で得られるものより 2~4 倍長いシーケンスのスカフォールド(N50 = 1.6M)を生成しました。また今回の研究で、異質四倍体の綿で重要な非対称の進化を明らかにしました。それぞれ、線維の改善とストレス耐性のための PSG(正の自然選択遺伝子)は、それぞれ A サブゲノムと D サブゲノムに焦点を当てました。要約すると、本研究は総合的なゲノム解析を提供し、異質四倍体の綿の A と D サブゲノムに関連した選択と進化プロセスを調べて、線維の改善に有益な情報を提供しました。

de-novo-データ
。シンテニー解析と異質四倍体の綿のゲノムの非対称の進化


Whole-genome sequencing of the snub-nosed monkey provides insights into folivory and evolutionary history.
Nature Genetics, 46:1303–1310 (2014)

Novogeneと中国科学院(Chinese Academy of Science)の研究者は、金色シシバナサル(旧世界サルの種)の全ゲノムシーケンスの共同研究を行いました。de novo ゲノムシーケンスのデータは他の 3 つの近縁種から得たゲノムリシーケンスのデータと比較することで、これらの霊長類独自の食餌に関連する進化的適応に対する洞察を提供しました。

de-novo-データ
。GSM と他の哺乳類の系統樹および推定される分岐時間。

Novogene の出版物

会誌
Nature Communications, 4:2071 (2013)Ground tit genome reveals avian adaptation to living at high altitudes in the Tibetan plateau.
Nature Genetics, 45:1431 (2013)Genomic analyses identify distinct patterns of selection in domesticated pigs and Tibetan wild boars.
Nature Biotechnology, 32:1045 (2014)De novo assembly of soybean wild realtives for pan-genome analysis of diversity and agronomic traits.
Nature Genetics, 46:1303 (2014)Whole-genome sequencing of the snub-nosed monkey provides insights into folivory and evolutionary history.
Nature Biotechnology 33:531 (2015)Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement.