キービジュアル画像

ゲノム多型データ解析

オミックスデータ解析

ゲノムワイド関連解析

ゲノム多型データは、SNPsチップや次世代シーケンサーによる変異callデータなどから得られます。このデータを利用してゲノムワイド関連解析(GWAS)を実施することができます。

Quality control解析

偽陽性を削減するためにquality control解析を行います。下記の基本解析に加えてデータごとに必要な解析を行います。

  1. 1.遺伝子型一致割合による血縁関係の同定
  2. 2.近交係数とrare allele数による適合基準の確認
  3. 3.性別の同定
  4. 4.Minor allele frequency (MAF)によるSNPsの足切り
  5. 5.Hardy-Weinberg平衡検定によるSNPs graphの確認と不良call SNPsの同定

遺伝子型一致割合による血縁関係の同定(左) 近交係数とrare allele数による適合基準の確認(右)

図1

性別の同定

図2

  • *弊社の解析経験では、200人に一人くらいの割合で実際の性別と解析結果の性別が異なることがあります。

Hardy-Weinberg平衡検定のQ-Q plot

図3-数式
図4

集団の構造化解析

関連を解析する集団間に分集団の不均衡が存在すると、分集団に特徴的なSNPsを多数検出してしまいます。そのため分集団の存在をチェックし、帰無仮説がどの程度の精度で成立しているのかを予め明らかにしておく必要があります。

EIGENSTRAT (Price et al. 2006)

図5

遺伝子型のCochran-Armitage trend testを行い、control集団別に偽陽性の量を推定

図6

関連解析

  • 遺伝子型trend test (exact)
  • Logistic回帰(バイアス調整)
  • Matched case-control study
  • Haplotype推定を用いた関連解析

コピー数推定

IlluminaのSNPsチップをaCGHデータとしてcopy number variation (CNV)を探索することができます。

Quality control解析

プローブの選択

図7

logR Ratio値の分散共分散行列を用いた主成分分析

図8

体細胞コピー数変異推定

多くのがん細胞ではある程度大域的な染色体コピー数異常が生じており、がん種毎に特徴的な増幅や欠失が見られることがあります。

体細胞コピー数変異推定結果をクラスタリングして増幅、欠失のヒストグラムと共に表示

図9

参考書籍: がんゲノムデータ解析 第4章がんのCNV検出
https://www.medsi.co.jp/products/detail/3866

技術調査

弊社が作成した技術調査報告書例を下記に載せました。