GEO数据库基本信息

嘿,说到GEO数据库,这是多年来我在问答论坛上经常被问到的问题。
说实话,在我眼里,这东西就像是科研界的瑞士军刀,方便又实用。

我第一次接触GEO是在2 01 0年左右,当时我还是一名博士生,正在研究肿瘤相关基因表达。
当时,为了找到特定基因在不同肿瘤样本中的表达,我只是简单地搜索了许多不同的数据库,GEO就是其中之一。

这个数据库,全称GeneExpressionOmnibus,是美国国家生物技术信息中心(NCBI)在2 000年创建的。
当时我觉得这个数据库相当有趣,因为它包含了世界各地研究人员上传的微阵列、二代序列等高通量基因表达数据,并且可以免费下载。
这对于我们这些做科学研究的人来说是个好消息。

我对GEO数据库的结构也相当熟悉。
主要分为两个子数据库:GEODataSets 和 GEOProfiles。
GEODataSets 将同一实验中的数据存储在数据集中,而 GEOProfiles 将数据集中基因的表达谱以基因单位存储。
记得有一次,为了分析肺癌样本中某个基因的表达情况,我在GEOProfiles中找到了很多相关数据。

GEO还有多种类型的数据,包括基因表达数据、非编码RNA表达谱数据、基因组甲基化数据等等。
在分析肿瘤样本的基因表达时,我使用了GEO中的RNA芯片数据。

搜索GEO数据库也很简单。
常用的是DataSet子数据库。
您只需输入相关关键词即可找到对应的数据集。
虽然 Profile 子数据库使用较少,但它允许您检索跨癌症类型的特定基因的表达谱,这在研究基因与疾病之间的关系时特别有用。

对于数据采集,可以通过GEO数据库网站或FTP下载。
我记得下载数据的时候我都是用FTP,很方便。

总体而言,GEO数据库是一个功能强大、数据类型丰富、组织结构清晰的高性能基因表达数据库。
它为科研人员提供了有价值的基因表达数据,是科学研究工作中不可或缺的。
当时,要寻找某个基因在不同肿瘤样本中的表达,我简直不知道没有GEO该怎么办。
所以,如果你正在进行基因表达研究,那么GEO数据库绝对是你的好帮手。

常用数据库 | Gene Expression Omnibus (GEO) 简述

GEO是NCBI开发的遗传数据库。
它建于2 000年,现在所有信息都公开了。
ChIP 数据和第二代测序可免费下载。
有原始数据、处理后的数据、样本数据和可视化。

在文章发表之前,数据必须传输到 GEO。
在文章中写下 GSE 编号,以便其他人可以找到它。

信息分为几类:
GPL:GPL5 7 0等测试工具
GSE:完整的测试数据、示例、图表和文本,如 GSE2 1 05 4 6
GDS:组织 GSE、分析,从 GDS 开始
配置文件:以图表形式单独查看基因
GSM:一些示例,例如 GSM1 1 4 1 06
获取数据: 直接进入GEO主页
关键字搜索,仅使用 PubMed 格式
例如,如果与“胃癌”相关,请使用(胃或胃)和(癌症或癌)。

在左侧选择样品类型,在右侧选择物种
分析和可视化:
GEO2 R是一种差异分析工具。

输入GENE和GSE编号,直接得到结果
也可以使用第三方工具
如何使用:-
获取数据
分析数据
分享结果
亲自看看。
这是第一个。