概要

ヒト全ゲノムシーケンス(HWGS)を解析することで、個々の遺伝子構成をカタログ化し、すべての遺伝変異(一塩基変異(SNV)、挿入と欠失(InDels)、コピー数多型(CNV)、および構造多型(SV))を検出できます。Novogeneは、強力なIllumina NovaSeq 6000システムを活用し、ゲノムあたり最小限のコストで年間最大280,000検体のヒトゲノムシーケンスが行えます。またOxfordNanopore PromethIONとPacBio Sequel Systemsを用いることで、特にショートリードシーケンスでは検出できないヒト全ゲノムにおける多型変異や反復領域の、完全で正確な同定を行い、欠落しているシーケンスリードを補完します。全ゲノムシーケンスと高度なバイオインフォマティクス解析の豊富な経験を持つNovogeneは、お客様のニーズに適切にお応えし、大規模なプロジェクトでも、高い品質と迅速な納期で提供いたします。
service specificationsアプリケーション
- 遺伝病研究
- 癌研究
- 人口増加
- DNAバイオマーカー
- 薬理ゲノミクス
Novogeneの強み
- 最先端のNGSテクノロジー:Novogeneは、IlluminaのHiSeqやNovaSeq 6000システムなど、世界でも最先端のテクノロジーを使用した世界最大規模のシーケンスサービスプロバイダーです。
- 最高のデータ品質:Q30スコアは80%以上を保証します。これはIlluminaの公式保証である75%以上です。 データの実例をご覧ください。
- 並外れたインフォマティクスの専門知識:Novogeneは最先端のバイオインフォマティクスパイプラインと、国際的に認められた最高クラスのソフトウェアを使用して、信頼性が高く、論文にすぐに使用できるデータをお客様に提供します
サンプル要件
Platform Type | Sample Type | Amount (Qubit®) | Purity |
Illumina Novaseq 6000
|
Genomic DNA | ≥200 ng |
OD260/280=1.8-2.0
|
Genomic DNA(PCR free) | ≥1.5 μg | ||
Genomic DNA from FFPE * | ≥0.8 μg | ||
PacBio Sequel I/II | HMW Genomic DNA | ≥10 μg (for Sequel I) ≥30 μg (for Sequel II) |
OD260/280=1.8-2.0; OD260/230=2.0-2.2; Fragments should be ≥ 30 Kb for Sequel I, ≥ 60 Kb for Sequel II |
Nanopore PromethION | HMW Genomic DNA | ≥10 μg | OD260/280=1.8-2.0; OD260/230=2.0-2.2; Fragments should be ≥ 30 Kb |
PacBio Revio | HMW Genomic DNA | ≥9 μg | OD260/280=1.8-2.0; OD260/230=2.0-2.2; Fragments should be ≥ 30 Kb |
シーケンスパラメーターと解析内容
Platform Type | Illumina Novaseq 6000 | PacBio Sequel I/II | Nanopore PromethION | PacBio Revio |
Read Length | Paired-end 150 bp | average > 10 Kb for Sequel I average > 15 Kb for Sequel II |
average > 17 Kb | average > 15 Kb |
Recommended Sequencing Depth
|
For tumor tissues: 50×, adjacent normal tissues and blood 30× | For genetic diseases: 10-20× | For genetic diseases: 10-20× | For genetic diseases: 10-20× |
For rare diseases: 30-50× | For tumor tissues: ≥20× | For tumor tissues: ≥20× | For tumor tissues: ≥20× | |
Standard Data Analysis
|
Data quality control | Data quality control | Data quality control | |
Alignment with reference genome | Sequence alignment | Sequence alignment | ||
SNP/InDel/SV/CNV detection | Structural variant (SV) detection | Structural variant (SV) detection | ||
Somatic SNP/InDel/SV/CNV detection (paired tumor samples) | Variation annotation | Variation annotation |
注:詳細については、サービス仕様をご参照ください。カスタマイズされたリクエストについては、お問い合わせください。
プロジェクトワークフロー

サンプリングとシーケンス方法:
サンプル
•初期HCC中国人患者182人
シーケンス方法:
•Illumina プラットフォーム(PE150)でのヒト全ゲノムシーケンス(49例)、全エクソームシーケンス(18例)、ターゲットシーケンス(115例)
結論:
WGSを用いたこの研究では、体細胞SNV / InDels、CNV、SVを含むゲノムの状況を検証し、HCCを有する49人の中国人患者から5つの顕著な変異の特徴を特定しました(図2)。初期HCCサンプル182検体の WGS、WES、ターゲットシーケンスを行った結果、WNK2、RUNX1T1、CTNNB1、TSC1、TP53が浸潤と転移因子である可能性があり、WNK2が変異頻度に最も有意な差があったことが示されました(図 3)。 これらの生体機能を検証した結果、がん抑制因子としてのWNK2の役割が明らかになりました。その不活性化は、HCC細胞におけるERK1 / 2シグナル伝達の活性化、腫瘍と結合しているマクロファージの浸潤、さらに腫瘍の成長と転移をもたらしました。 本研究によって中国人患者のHCCを特徴づけるゲノム変化を明らかにし、WNK2を、治療切除後に早期腫瘍再発に関与しているHCCにおけるドライバーであることを示しました。
若い非喫煙者における肺腺癌のゲノム変化の特徴(Luo et al.,2018)
緒論:
非小細胞肺癌(NSCLC)は、各下位集団に表現型および遺伝子型の多様性を伴う非常に不均一な疾患として認識されています。 NSCLCの非喫煙者の患者は次世代シーケンスを通じて十分に研究されていますが、若い非喫煙者のNSCLC患者における隠された特異的分子の特徴はほとんどわかっていません。
サンプリングとシーケンス方法:
サンプル
•非喫煙者の肺腺癌(LUAD)患者36人
シーケンス方法:
•Illuminaプラットフォーム(PE150)でのヒト全ゲノムシーケンス
結論
この研究では、よく知られている遺伝子変異に加えて、まれに報告されるいくつかの潜在的な肺癌関連遺伝子変異(HOXA4やMST1など)が同定されました。 肺癌に関連するコピー数多型(EGFRやCDKN2Aなど)は濃縮され、肺癌に関連する構造多型(EML4-ALKおよびKIF5B-RETなど)も共通して観察されました。 特に、ALK(SMG6-ALK)とRET(JMJD1C-RET)の新しい融合パートナー遺伝子が見つかりました。 さらに、高い有病率で且つ潜在的に標的化可能なゲノム変化がコホートで観察されました。 最後にこの研究によって、BPIFB1、CHD4、PARP1、NUDT1、RAD52、MFI2の生殖細胞変異は、LUADの若い非喫煙者患者で有意に濃縮されていることが、作成した非癌データベースと照合して特定されました(p <0.05)。 この研究は、若い非喫煙者で起こるLUADの詳細な突然変異を明らかにし、NSCLCサブグループの異なる分子病因への示唆を与えました。
扁平上皮異形成から癌までの、食道組織の遺伝的変化(Liu et al.,2017)
緒論:
食道扁平上皮癌(ESCC)は、食道癌の最も一般的なサブタイプです。 ESCCの発生中に食道細胞で発生する遺伝的変化についてはほとんど知られていません。 この研究では、同じ患者の食道非腫瘍、上皮内腫瘍(IEN)、およびESCC組織を次世代シーケンスによる解析を行い、腫瘍発生中の遺伝的変化を追跡しました。
サンプリングとシーケンス方法:
サンプル
•切除を受けているESCC患者70人からの食道組織サンプル227検体
シーケンス方法:
•ヒト全ゲノムシーケンス(7ケース)、全エクソームシーケンス(18ケース)、およびIlluminaプラットフォーム(PE150)でのターゲット領域シーケンス(45ケース)
結論
この研究によって、IENとESCC間の変異の種類と頻度に有意な類似性があることが明らかになりました(図1)。これには、DNA損傷の変異的特徴の類似性も含まれます。 CCND1、CDKN2A、およびFGFR1遺伝子の変異が、系統発生解析およびクローン解析から、初期のドライバー遺伝子変異として同定されました。 しかしながら、同じ個体から採取した組織の重複しないSNVの数から、さまざまな病変が独立して形成され、変異の独立したクローン拡大があったことを示していました。 本研究で実証されたように、複数のNGSアプリケーションを使用することで、癌の早期診断と治療を探索するための新たらアプローチを提供できます。
Sequencing error rate distribution
GC content distribution
Sequencing depth & coverage distribution
SNP detection
Sample | Sample_1 | Sample_2 | Sample_3 | Sample_4 | Sample_5 | Sample_6 |
CDS | 22318 | 22343 | 22271 | 22702 | 22654 | 22418 |
Synonymous SNP | 11342 | 11375 | 11329 | 11,439.00 | 11387 | 11376 |
missense SNP | 10335 | 10340 | 10334 | 10643 | 10649 | 10400 |
stopgain | 77 | 81 | 72 | 87 | 87 | 8.30 |
stoploss | 14 | 13 | 11 | 12 | 12 | 10 |
unknown | 558 | 541 | 536 | 531 | 528 | 501 |
itronic | 1263778 | 1261992 | 1262435 | 1259099 | 1262095 | 1271575 |
UTR3 | 25167 | 25134 | 25496 | 25396 | 25462 | 25510 |
UTR5 | 5568 | 5562 | 5644 | 5767 | 5829 | 5702 |
splicing | 84 | 85 | 84 | 86 | 90 | 96 |
ncRNA exonic | 11867 | 11818 | 11734 | 11628 | 11697 | 11760 |
ncRNA intronic | 205360 | 205028 | 200363 | 199813 | 200397 | 205018 |
ncRNA splicing | 66 | 66 | 58 | 61 | 64 | 60 |
upstream | 22383 | 22339 | 22230 | 22648 | 22744 | 22708 |
downstream | 23565 | 23544 | 23515 | 23221 | 23235 | 23557 |
intergenic | 2119447 | 2115048 | 2110391 | 2091107 | 2098406 | 2138433 |
Total | 3700477 | 3693838 | 3685038 | 3662384 | 3673519 | 3727684 |
Circos
Novogene shows Circos only when CNV analysis was carried out. The figure consists seven rings from outer to inner.
(1) The outer circle (the first circle) is chrome information.
(2) The second ring represents the read coverage in histogram style. A histogram is the average coverage of a 0.5Mbp region.
(3) The third ring represents indel density in scatter style. A black dot is calculated as indel number in a range of 1Mbp.
(4) The fourth ring represents snp density in scatter style. A green dot is calculated as snp number in a range of 1Mbp.
(5) The fifth ring represents the proportion of homozygous SNP (orange) and heterozygous SNP (grey) in histogram style. A histogram is calculated from a 1Mbp region.
(6) The sixth ring represents the CNV inference. Red means gain, and green means loss.
(7) The most central ring represents the SV inference in exonic and splicing regions. TRA (orange), INS (green), DEL (grey), DUP (pink) and INV (blue).
Heatmap of significantly mutated genes
Linkage analysis
