索引更新

为新数据更新

  • 对于-U或者-D SCD数据,已有倒排表中对变更的数据进行删除;数据更新后,如果导致原有keyword不再存在,在倒排索引中其对于的keywordid依然存在,keywordid对应的doc数为0;
  • 对于-R 更新,倒排表中的数据无需更新,更新Btree索引;

定时更新

  • 当索引桶的个数达到一定数量时,系统对索引捅进行merge操作,将其合并为一个桶;
  • 也可以将桶的合并更新操作设置为Cron-job, 定期合并索引桶以提高检索效率;