如何评估要使用怎样机器配置来安装TigerGraph,如CPU、内存和磁盘空间的大小?

如何评估要使用怎样机器配置来安装TigerGraph,如CPU、内存和磁盘空间的大小?

评估机器配置是一项比较复杂的工作,需要考虑多种因素。大致可参考如下流程如下:

首先,图数据库的存储同时存储点(及其上的属性)和边(及其上的属性),因此Schema设计得越复杂,点和边的数量越多,占用存储空间越大,由于TigerGraph会将图数据库放到内存中,因此需要用的内存也更大。所以要依据Schema的设计,以及点、边、属性的类型和多少,评估出要占用多少空间,记为A。

其次,TigerGraph支持数据压缩,一般占用内存为原始数据量A的40%-60%,将该空间记为B。

第三,还要考虑如下三个因素:

  1. 数据要增量更新,因此要为增量数据留足空间;
  2. 执行查询语句时需要额外申请内存,也要预判查询的复杂度和并发情况;
  3. 未来Schema上可能会新增点、边和属性,因此也要为这种变化预留空间。

以上各因素每个客户的情况都不同,因此需要客户根据实际情况进行评估。从以往的案例来看,推荐使用的内存至少要是B的三倍以上,记为C。推荐使用的磁盘空间则至少是C的三倍以上。
(说明:以上说的内存大小,对于分布式情况来说,指的是总内存大小。)

CPU可根据查询的复杂度、QPS以及响应时间综合考虑,建议至少在20核以上。

另外,当采用分布式方案时,网络开销会比较大,因此建议使用至少1G以上的网卡。此外,比起使用较差配置的较多节点,更推荐使用更优配置的更少节点,比如:256G内存/节点 * 32节点,不如512G内存/节点 * 16节点,因为节点数越少,网络开销越小。

想了解更多信息请进 https://docs.tigergraph.com.cn/admin/admin-guide/hw-and-sw-requirements

如何配置tigergraph使用的内存大小?Perf.gpe.gpath
_memory_limit?

perf.gpe.edgedata_memory_limit是用来配置存储边的内存大小的,超过这个限制就会进磁盘,单位为GB,默认为-1,不做限制。