背景

1-1. ヒトゲノム計画 背景
  ヒトゲノム計画の急速な進展の結果、現在までに、第20( Deloukas et al ), 21(Hattori et al), 22(Dunham et al )番染色体の塩基配列決定がは既に完了している。 またドラフトシークエンス解析(Nature 2001, Science 2001)も一応の終結を迎え、全ゲノム配列の最終決定はここ数年以内(Collins et al)に見込まれており、ヒトゲノム計画は、 その当初の目的であった「ヒトゲノム全遺伝子配列の決定」に向けて最終段階を迎えようとしている。 現在のシークエンスを精度の高い最終データにまで完成させるには、依然多くの作業が残されているもの の、今、我々はワトソンとクリックによりDNA二重らせん構造が発見されて以来始めて、様々な生命現象を担うべき 遺伝子を総体として概観しうる立場に立ったと言えよう。
  情報学的な解析手法の向上も著しい。いかに膨大なゲノムの配列から意味ある生物学的情報を抽出するかに ついての様々な試みは日進月歩である。 解析の終了したシークエンスデータは暫時 Golden PathNCBIHGREP 等によって整理、 公開されており、その計算機的な遺伝子解析の試みは枚挙に暇がない。 しかし、依然として純粋に計算機的な手法のみでは、遺伝子の構造、機能を高い確度で予測することは困難である。
1-2. ヒトcDNA解析計画 背景

  cDNAはmRNAの正確なコピーでありゲノム上のどの部分が転写されスプライスを受けるかといった 遺伝子の構造情報を保持している。またcDNAはタンパク質翻訳領域を連続した形で含んでおり、 直接タンパク質翻訳の鋳型として利用できるために、組換えタンパク質の作成には不可欠である。 以上のように遺伝子機能解析においてcDNAの単離、解析は不可欠な要素であることから、 ヒトゲノム計画と平行して ヒトcDNA解析計画も急速に進められてきた。 現在一般に公開されている様々なcDNAデータベースには何百万という cDNAの断片配列 (EST配列)が登録されている。
  NCBIでは、これら蓄積されたEST配列から不要な冗長性を除去し、 重複のない「参照cDNAセット」を 構築すべく RefSeq計画が始動しており、 現在、約15,000種類のヒト遺伝子cDNAがカタログ化されている。 膨大な量のESTデータから意味のあるcDNA配列を抽出したという意味で、RefSeq構築の意義は大きい。 しかし依然としてその多くのcDNA配列が正確な5'端塩基配列の情報を欠損しているという意味では、 RefSeqも 完全なcDNAデータベースであるとは言い難い。これはRefSeq構築の元となるcDNAが、 ほとんどの場合、 通常の手法により作成されたcDNA libraryから単離されたものであるために 5'端を欠損していることに 起因する。

1-3. ヒト完全長cDNA解析計画 背景

  我々は従来のcDNA配列データの欠点を補うべく、完全長cDNAの収集と解析を試みている。 後述するように効率よく完全長cDNAの収集を行うためには、従来の方法により作成された cDNA libraryは不適当である( 2-1. 従来のcDNAライブラリー作成技術の欠点)。 そこで我々はmRNA5'端に存在するキャップ構造を特異的に選別する オリゴキャッピング法を開発し、 同法を用いて 完全長および5'端特異的cDNA library を作成し、その大規模解析を行っている。
    我々の収集している完全長cDNAは以下の解析に不可欠である。
  1. 遺伝子構造の完全な決定
  2. 組換えタンパク質の作成
これらの目的に供するために、日本ではNEDOが主導する形で「完全長cDNA解析計画」が行われている。 同計画の詳細については、同ホームページを参照されたい。
    また完全長cDNAの5'端配列を用いて以下の解析が可能である。
  1. 転写開始点(TSS)の正確な決定
  2. TSSに隣接するプロモーター領域の同定
これらについては3. 完全長cDNA解析の意義に後述する。

<<Back