お問い合わせは こちら
皆様の研究の ニーズに関して お気軽にご相談ください
サービス

ヒト全ゲノムシーケンス

概要

ヒト全ゲノムシーケンス(HWGS)を解析することで、個々の遺伝子構成をカタログ化し、すべての遺伝変異(一塩基変異(SNV)、挿入と欠失(InDels)、コピー数多型(CNV)、および構造多型(SV))を検出できます。Novogeneは、強力なIllumina NovaSeq 6000システムを活用し、ゲノムあたり最小限のコストで年間最大280,000検体のヒトゲノムシーケンスが行えます。またOxfordNanopore PromethIONとPacBio Sequel Systemsを用いることで、特にショートリードシーケンスでは検出できないヒト全ゲノムにおける多型変異や反復領域の、完全で正確な同定を行い、欠落しているシーケンスリードを補完します。全ゲノムシーケンスと高度なバイオインフォマティクス解析の豊富な経験を持つNovogeneは、お客様のニーズに適切にお応えし、大規模なプロジェクトでも、高い品質と迅速な納期で提供いたします。

service specifications

アプリケーション

  • 遺伝病研究
  • 癌研究
  • 人口増加
  • DNAバイオマーカー
  • 薬理ゲノミクス

Novogeneの強み

  • 最先端のNGSテクノロジー:Novogeneは、IlluminaのHiSeqやNovaSeq 6000システムなど、世界でも最先端のテクノロジーを使用した世界最大規模のシーケンスサービスプロバイダーです。
  • 最高のデータ品質:Q30スコアは80%以上を保証します。これはIlluminaの公式保証である75%以上です。 データの実例をご覧ください。
  • 並外れたインフォマティクスの専門知識:Novogeneは最先端のバイオインフォマティクスパイプラインと、国際的に認められた最高クラスのソフトウェアを使用して、信頼性が高く、論文にすぐに使用できるデータをお客様に提供します

サンプル要件

Platform Type Sample Type Amount (Qubit®) Purity
Illumina Novaseq 6000
Genomic DNA ≥200 ng
OD260/280=1.8-2.0
Genomic DNA(PCR free) ≥1.5 μg
Genomic DNA from FFPE * ≥0.8 μg
PacBio Sequel I/II HMW Genomic DNA ≥10 μg (for Sequel I)
≥30 μg (for Sequel II)
OD260/280=1.8-2.0;
OD260/230=2.0-2.2;
Fragments should be ≥ 30 Kb for Sequel I, ≥ 60 Kb for Sequel II
Nanopore PromethION HMW Genomic DNA ≥10 μg OD260/280=1.8-2.0;
OD260/230=2.0-2.2;
Fragments should be ≥ 30 Kb
PacBio Revio HMW Genomic DNA ≥9 μg OD260/280=1.8-2.0;
OD260/230=2.0-2.2;
Fragments should be ≥ 30 Kb

シーケンスパラメーターと解析内容

Platform Type Illumina Novaseq 6000 PacBio Sequel I/II Nanopore PromethION PacBio Revio
Read Length Paired-end 150 bp average > 10 Kb for Sequel I
average > 15 Kb for Sequel II
average > 17 Kb average > 15 Kb
Recommended Sequencing Depth
For tumor tissues: 50×, adjacent normal tissues and blood 30× For genetic diseases: 10-20× For genetic diseases: 10-20× For genetic diseases: 10-20×
For rare diseases: 30-50× For tumor tissues: ≥20× For tumor tissues: ≥20× For tumor tissues: ≥20×
Standard Data Analysis
Data quality control Data quality control Data quality control
Alignment with reference genome Sequence alignment Sequence alignment
SNP/InDel/SV/CNV detection Structural variant (SV) detection Structural variant (SV) detection
Somatic SNP/InDel/SV/CNV detection (paired tumor samples) Variation annotation Variation annotation

注:詳細については、サービス仕様をご参照ください。カスタマイズされたリクエストについては、お問い合わせください

プロジェクトワークフロー

サンプリングとシーケンス方法:

サンプル
•初期HCC中国人患者182人

シーケンス方法:
•Illumina プラットフォーム(PE150)でのヒト全ゲノムシーケンス(49例)、全エクソームシーケンス(18例)、ターゲットシーケンス(115例)

結論

WGSを用いたこの研究では、体細胞SNV / InDels、CNV、SVを含むゲノムの状況を検証し、HCCを有する49人の中国人患者から5つの顕著な変異の特徴を特定しました(図2)。初期HCCサンプル182検体の WGS、WES、ターゲットシーケンスを行った結果、WNK2、RUNX1T1、CTNNB1、TSC1、TP53が浸潤と転移因子である可能性があり、WNK2が変異頻度に最も有意な差があったことが示されました(図 3)。 これらの生体機能を検証した結果、がん抑制因子としてのWNK2の役割が明らかになりました。その不活性化は、HCC細胞におけるERK1 / 2シグナル伝達の活性化、腫瘍と結合しているマクロファージの浸潤、さらに腫瘍の成長と転移をもたらしました。 本研究によって中国人患者のHCCを特徴づけるゲノム変化を明らかにし、WNK2を、治療切除後に早期腫瘍再発に関与しているHCCにおけるドライバーであることを示しました。

Figure 1. Genomic alterations and mutational signatures in 49 Chinese primary HCCs that had tumor early.

Figure 2. The mutational spectrum in HCCs with or without early recurrence.

若い非喫煙者における肺腺癌のゲノム変化の特徴(Luo et al.,2018)

緒論

非小細胞肺癌(NSCLC)は、各下位集団に表現型および遺伝子型の多様性を伴う非常に不均一な疾患として認識されています。 NSCLCの非喫煙者の患者は次世代シーケンスを通じて十分に研究されていますが、若い非喫煙者のNSCLC患者における隠された特異的分子の特徴はほとんどわかっていません。

サンプリングとシーケンス方法:

サンプル
•非喫煙者の肺腺癌(LUAD)患者36人

シーケンス方法:
•Illuminaプラットフォーム(PE150)でのヒト全ゲノムシーケンス

結論

この研究では、よく知られている遺伝子変異に加えて、まれに報告されるいくつかの潜在的な肺癌関連遺伝子変異(HOXA4やMST1など)が同定されました。 肺癌に関連するコピー数多型(EGFRやCDKN2Aなど)は濃縮され、肺癌に関連する構造多型(EML4-ALKおよびKIF5B-RETなど)も共通して観察されました。 特に、ALK(SMG6-ALK)とRET(JMJD1C-RET)の新しい融合パートナー遺伝子が見つかりました。 さらに、高い有病率で且つ潜在的に標的化可能なゲノム変化がコホートで観察されました。 最後にこの研究によって、BPIFB1、CHD4、PARP1、NUDT1、RAD52、MFI2の生殖細胞変異は、LUADの若い非喫煙者患者で有意に濃縮されていることが、作成した非癌データベースと照合して特定されました(p <0.05)。 この研究は、若い非喫煙者で起こるLUADの詳細な突然変異を明らかにし、NSCLCサブグループの異なる分子病因への示唆を与えました。

Figure 3. Mutation landscape of lung adenocarcinoma in young never-smoker patients.

扁平上皮異形成から癌までの、食道組織の遺伝的変化(Liu et al.,2017)

緒論

食道扁平上皮癌(ESCC)は、食道癌の最も一般的なサブタイプです。 ESCCの発生中に食道細胞で発生する遺伝的変化についてはほとんど知られていません。 この研究では、同じ患者の食道非腫瘍、上皮内腫瘍(IEN)、およびESCC組織を次世代シーケンスによる解析を行い、腫瘍発生中の遺伝的変化を追跡しました。

サンプリングとシーケンス方法:

サンプル
•切除を受けているESCC患者70人からの食道組織サンプル227検体

シーケンス方法:
•ヒト全ゲノムシーケンス(7ケース)、全エクソームシーケンス(18ケース)、およびIlluminaプラットフォーム(PE150)でのターゲット領域シーケンス(45ケース)

結論

この研究によって、IENとESCC間の変異の種類と頻度に有意な類似性があることが明らかになりました(図1)。これには、DNA損傷の変異的特徴の類似性も含まれます。 CCND1、CDKN2A、およびFGFR1遺伝子の変異が、系統発生解析およびクローン解析から、初期のドライバー遺伝子変異として同定されました。 しかしながら、同じ個体から採取した組織の重複しないSNVの数から、さまざまな病変が独立して形成され、変異の独立したクローン拡大があったことを示していました。 本研究で実証されたように、複数のNGSアプリケーションを使用することで、癌の早期診断と治療を探索するための新たらアプローチを提供できます。

Figure 4. The mutation variation landscape of ESCC, IEN, and simple hyperplasia (ESSH) from whole genome sequencing and whole exome sequencing.
Reference: Liu X, Zhang M, Ying SM, et al. Genetic alterations in esophageal tissues from squamous dysplasia to carcinoma[J]. Gastroenterology, 2017, 153: 166‒177.

Sequencing error rate distribution

Note: The x-axis represents position in reads, and the y-axis represents the average error rate of bases of all reads at a position.

GC content distribution

Note: The x-axis is position in reads, and the y-axis is percentage of each type of bases (A, T, G, C); different bases are distinguishable by different colors.

Sequencing depth & coverage distribution

Note: Average sequencing depth (bar plot) and coverage (dot-line plot) in each chromosome. The x-axis represents chromosome; the left y-axis is the average depth; the right y-axis is the coverage (proportion of covered bases).

SNP detection

Sample Sample_1 Sample_2 Sample_3 Sample_4 Sample_5 Sample_6
CDS 22318 22343 22271 22702 22654 22418
Synonymous SNP 11342 11375 11329 11,439.00 11387 11376
missense SNP 10335 10340 10334 10643 10649 10400
stopgain 77 81 72 87 87 8.30
stoploss 14 13 11 12 12 10
unknown 558 541 536 531 528 501
itronic 1263778 1261992 1262435 1259099 1262095 1271575
UTR3 25167 25134 25496 25396 25462 25510
UTR5 5568 5562 5644 5767 5829 5702
splicing 84 85 84 86 90 96
ncRNA exonic 11867 11818 11734 11628 11697 11760
ncRNA intronic 205360 205028 200363 199813 200397 205018
ncRNA splicing 66 66 58 61 64 60
upstream 22383 22339 22230 22648 22744 22708
downstream 23565 23544 23515 23221 23235 23557
intergenic 2119447 2115048 2110391 2091107 2098406 2138433
Total 3700477 3693838 3685038 3662384 3673519 3727684

Circos

Note:
Novogene shows Circos only when CNV analysis was carried out. The figure consists seven rings from outer to inner.
(1) The outer circle (the first circle) is chrome information.
(2) The second ring represents the read coverage in histogram style. A histogram is the average coverage of a 0.5Mbp region.
(3) The third ring represents indel density in scatter style. A black dot is calculated as indel number in a range of 1Mbp.
(4) The fourth ring represents snp density in scatter style. A green dot is calculated as snp number in a range of 1Mbp.
(5) The fifth ring represents the proportion of homozygous SNP (orange) and heterozygous SNP (grey) in histogram style. A histogram is calculated from a 1Mbp region.
(6) The sixth ring represents the CNV inference. Red means gain, and green means loss.
(7) The most central ring represents the SV inference in exonic and splicing regions. TRA (orange), INS (green), DEL (grey), DUP (pink) and INV (blue).

Heatmap of significantly mutated genes


Linkage analysis

Note: The upper x-axis is chromosome number; the lower x-axis is centimorgan (cM). And the y-axis is LOD score.