キービジュアル画像

オミックスデータ解析 ゲノム多型データ

ゲノムワイド関連解析

ゲノム多型データは、SNPsチップや次世代シーケンサーによる変異callデータなどから得られます。このデータを利用してゲノムワイド関連解析(GWAS)を実施することができます。

Quality control解析

偽陽性を削減するためにquality control解析を行います。下記の基本解析に加えてデータごとに必要な解析を行います。

  1. 1.遺伝子型一致割合による血縁関係の同定
  2. 2.近交係数とrare allele数による適合基準の確認
  3. 3.性別の同定
  4. 4.Minor allele frequency(MAF)によるSNPsの足切り
  5. 5.HWE検定によるSNPs graphの確認と不良call SNPsの同定

遺伝子型一致割合による血縁関係の同定

近交係数とrare allele数による適合基準の確認

図1

性別の同定

図2
  • *弊社の解析経験では200人に一人くらい実際の性別と解析結果の性別が異なることがあります。

HWE検定のQ-Q plot

図3

集団の構造化解析

関連を解析する集団間に分集団の不均衡が存在すると、分集団に特徴的なSNPsを多数検出してしまいます。そのため分集団の存在をチェックし、帰無仮説がどの程度の精度で成立しているのかを予め明らかにしておく必要があります。

EIGENSTRAT(Price et al. 2006)

図4

上図は、ヒトの遺伝子解析における集団存在相関の例であり、人種や民族に対する優劣などを表現するものではありません。

遺伝子型のCochran-Armitage trend testを行い、control集団別に偽陽性の量を推定

図5

関連解析

  • 遺伝子型trend test(exact)
  • Logistic回帰(バイアス調整)
  • Matched case-control study
  • Haplotype推定を用いた関連解析

コピー数推定

IlluminaのSNPsチップをaCGHデータとしてcopy number variation(CNV)を探索することが出来ます。

Quality control解析

プローブの選択

図6

logR Ratio値の分散共分散行列を用いた主成分分析

図7

体細胞コピー数推定

多くのがん細胞ではある程度大域的な染色体コピー数異常が生じており、がん種毎に特徴的な増幅や欠失が見られることがあります。

体細胞コピー数推定結果をクラスタリングして増幅、欠失のヒストグラムと共に表示

図8

参考書籍:がんゲノムデータ解析 第4章がんのCNV検出

技術調査

弊社が作成した技術調査報告書例を下記に載せました。