|
cDNAはmRNAの正確なコピーでありゲノム上のどの部分が転写されスプライスを受けるかといった
遺伝子の構造情報を保持している。またcDNAはタンパク質翻訳領域を連続した形で含んでおり、
直接タンパク質翻訳の鋳型として利用できるために、組換えタンパク質の作成には不可欠である。
以上のように遺伝子機能解析においてcDNAの単離、解析は不可欠な要素であることから、
ヒトゲノム計画と平行して ヒトcDNA解析計画も急速に進められてきた。
現在一般に公開されている様々なcDNAデータベースには何百万という cDNAの断片配列
(EST配列)が登録されている。
NCBIでは、これら蓄積されたEST配列から不要な冗長性を除去し、
重複のない「参照cDNAセット」を 構築すべく
RefSeq計画が始動しており、
現在、約15,000種類のヒト遺伝子cDNAがカタログ化されている。
膨大な量のESTデータから意味のあるcDNA配列を抽出したという意味で、RefSeq構築の意義は大きい。
しかし依然としてその多くのcDNA配列が正確な5'端塩基配列の情報を欠損しているという意味では、
RefSeqも 完全なcDNAデータベースであるとは言い難い。これはRefSeq構築の元となるcDNAが、
ほとんどの場合、 通常の手法により作成されたcDNA libraryから単離されたものであるために
5'端を欠損していることに 起因する。
|
|