キービジュアル画像

スキーマレスデータベースを用いた可変項目データベース構築サービス

研究開発の現場では、メタ情報を含めてデータ項目が増え続けるため、データベース化したいデータ項目を予め決めることが困難な場合があります。XML DBやJSON DBなどのスキーマレスデータベースを用いることで柔軟なデータベースを実際に運用しながら開発を行うことができます。

スキーマレスDBの特徴

NoSQLデータベースは、非リレーショナルデータベース(非RDB)を指し、データ構造により、「キー・バリュー型」、「カラム指向型」、「グラフ型」、「ドキュメント型」等に分類されます。その工夫されたデータ構造により、特定の用途において従来のリレーショナルデータベースよりも高い性能を発揮することがあります。中でもスキーマレスデータベースはスキーマを定義することなくデータベースを構築することが可能であり、例えば以下のようなユースケースに適用することができます。

  • 活用するデータの形式に適したデータ構造をもつデータベースの利用により、データ処理などに対する開発コスト削減や検索性能向上を図る。
  • PoC事業等データベースの構成変更が発生しやすいアジャイル型プロトタイプシステム開発において、PDCAのサイクルを早めることで開発システムの課題整理・要件整理を行う。
  • データ項目が増え続けていくような研究用データベースの開発を行う。

当社ではご利用目的とデータの特徴から、最適と考えられるデータベース管理システム(DBMS)をご提案させていただき、データベースを構築させていただきます。

データベース構築サービスの概要(ドキュメント型の場合)

図1

実装例とGUIの構築例

エンドユーザーが利用するデータベースではgraphical user interface (GUI)による操作環境の構築が必要になります。実際に操作するユーザーに使用していただきながら構築作業を進めていきます。

GUI構築例

  • ゲノム変異アノテーションデータベース

疾患等に関連するゲノム変異の探索では、個人ごとに同定される膨大な変異の中から原因変異を同定する作業が発生します。この目的のために様々なアノテーション情報を変異ごとに付与しデータベースを構築しますが、研究の進捗に伴い付与されるアノテーション項目が増えていきます。この可変項目に対応したデータベースとしてBaseX*1やMongoDB*2を用いてデータベース化することができます。

図2

  • ACMG®ガイドライン*3変異判定入出力システム

ユーザーが判定したACMGガイドラインの結果をデータベースに追加する機能等を付与することができます。

図3
  • *ACMGは、American College of Medical Genetics and Genomicsの登録商標です。
  • *3Richards et al., Genetics in Medicine volume 17, pages405-423(2015), doi: 10.1038/gim.2015.30