开发软件,你不可能逃脱数据库。7个大厂都在用的数据库,你懂的

研究药的都能能用上!这个数据库太实用,比想象中更牛!

哈,我已经多次使用过STITCH数据库,特别是在进行中草药网络药理分析时。
非常方便。
但想要使用顺利,就得花点心思。
比如我去年在研究黄芪多糖。
我刚开始用Itembyname研究黄芪多糖,但发现它根本不直接含有这种成分。
后来我改变了主意,利用其化学结构函数,将黄芪多糖单体的主要化学结构输入SMILES公式,然后找到了相关目标。
这提醒我,要使用这个数据库,你需要了解一些化学背景,而不能只是盲目地按名称搜索。

还有一个CancerHSP的子数据库,我以前研究抗癌药方时用过。
中草药抗癌药物的化合物和靶点信息相当完整,特别是不同癌细胞系的活性数据。
但请注意,这部分数据于2 01 8 年首次收集,部分新药或新靶点可能不包括在内。
我正在研究三氧化二砷的案例,它显示的目标与最新文献中报道的略有不同。
最后,我不得不亲自检查一下。

我没怎么用过PreDC子数据库。
听说最近在维护,可能不稳定。
不过,CVDSP子数据库对我帮助很大。
当我研究丹参时,我直接将丹参酮化合物与心血管目标联系起来,这节省了我很多时间。
不过,该数据库中的化合物信息截至2 02 0年,新上市药物的某些成分可能找不到。

总的来说,STITCH是一个很好的工具,但它并不是灵丹妙药。
尤其是中草药成分复杂,主要依靠化学结构相关的目标。
对于那些成分不明确的传统方剂来说,作用不大。
如果你把现代药物研究用来拓展靶点或者探索机制,效率确实很高。
但如果你是做纯粹的文献综述或者想深入了解某个方剂的经典理论,这对你帮助不大。

无论如何,你必须很了解他,当...使用它。
不要将其视为最终答案。
您必须将其与其他数据库和经验数据一起查看。

现在有哪些广泛使用的时序数据库?

2 02 2 年,在某个城市,我参与了一个需要处理大量物联网数据的项目。
当时我们面临着使用开源时序数据库还是云服务时序数据库的选择。
我很困惑,因为有这么多具有​​不同特征的类型。

首先我们考虑了InfluxDB,它基于TSM存储引擎,写入性能高达每秒2 0万个数据点,听起来不错,但我们的数据量可能更大。
然后是TimescaleDB,它基于PostgreSQL,兼容SQL,支持自动分片和压缩。
这听起来很广泛,但我们的需求可能更加实时。

接下来我们看一下国内自主研发的TDengine。
单节点写入能力达千万级/秒,支持1 0倍无损压缩,集群功能开源。
这听起来很强大,但是我们的场景可能更适合云服务。

因此,我们转向像 Amazon Timestream 这样的云服务时间序列数据库,它集成了 IoTCore 和 QuickSight,并支持自动数据分层。
看起来非常适合云原生的物联网设备管理,但是价格可能有点贵。

然后是阿里云TSDB,兼容OpenTSDB协议,拥有自研压缩算法优化存储效率,支持百万设备接入。
一个典型的案例就是智慧城市交通流量监控,看起来非常适合我们的需求。

腾讯CTSDB、HBase基于扩展的分布式架构,支持PB级数据存储和高并发写入。
其应用包括微信游戏赛段实时统计、游戏服务器性能监控等,也颇具吸引力。

最后,我们考虑了特殊领域的时间序列数据库,例如 KDB+,它专为高频交易而设计,支持亚毫秒级响应,这对于量化金融和股票市场的实时波动率计算非常有用。

后来我意识到也许我有偏见,因为每个数据库都有自己独特的优势。
我们最终选择了阿里云TSDB,因为它在存储效率和设备访问方面表现出色,而且价格相对合理。

现在回想起来,当时的选择其实是相当困难的,但通过比较和权衡,我们还是找到了最适合自己的解决方案。