Teradata 散列算法

2018-01-12 15:00 更新

基于主索引值将行分配给特定的AMP。 Teradata使用散列算法来确定哪个AMP获取行。

以下是散列算法的高级图。

散列算法的高级图

以下是插入数据的步骤。

  • 客户端提交查询。

  • 解析器接收查询并将记录的PI值传递给散列算法。

  • 散列算法散列主索引值,并返回一个32位数,称为行散列。

  • 散列算法散列主索引值,并返回一个32位数,称为行散列。...

  • BYNET将数据发送到标识的AMP。

  • AMP使用32位行散列来定位其磁盘中的行。

  • 如果存在具有相同行散列的任何记录,则它递增作为32位数的唯一性ID。 对于新行散列,唯一性ID分配为1,并在每次插入具有相同行散列的记录时递增。

  • 行散列和唯一性ID的组合称为行ID。

  • 行ID为磁盘中的每个记录。

  • AMP中的每个表行都按其行ID进行逻辑排序。

如何存储表

表按其行ID(行散列+唯一性id)排序,然后存储在AMP中。 行ID与每个数据行一起存储。

行哈希唯一性ID员工不名字
2A01 26112A01 2611...101MikeJames
2A01 26120000 0001104AlexStuart
2A01 26130000 0001102RobertWilliams
2A01 26140000 0001105RobertJames
2A01 26150000 0001103PeterPaul
以上内容是否对您有帮助:
在线笔记
App下载
App下载

扫描二维码

下载编程狮App

公众号
微信公众号

编程狮公众号