FAQ
这里介绍 FAQ
谁会成为下一代统一元数据方案?
- 也许
Hadoop
风光不再,但Hive Metastore
却越发坚挺,很多第三方如Flink
、Doris
等都纷纷主动支持; - 也许
Apache Gravitino
( https://gravitino.apache.org/ ),可以让 One Meta 照进现实; - 也许 最终都不会存在一个生产环境的统一元数据系统,毕竟元数据的首要职责还是服务于主数据的,它们天生就应该在一起。
为什么要 Single Source of Truth?
这是保证数据一致性的必要条件,简单讲就是数据可以有很多份,但是当出现数据不一致时,应该听谁的?
Metaplus
深刻认识到这一点,所以没有去争那个 ”Source“,安静的做一个 ”Replica“ 就好。对于数据的发现、管理和治理来讲,一个 ”副本“ 足矣。
只不过 Metaplus
这个副本,更加的强大和可靠。
有哪些优秀的元数据副本方案?
Amundsen
( https://www.amundsen.io/ ) : Lyft出品,基于Python,可以像Google搜索一下搜索data。OpenMetadata
(https://open-metadata.org/) : 有丰富的数据连接器,非常漂亮的WebUI。Apache Atlas
(https://atlas.apache.org/) : 历史悠久的Apache顶级项目,