greenplum和hadoop对比 mpp数据库有哪些


前段时间在网上看到一张大数据行业全景图,几乎涵盖了大数据相关的全部技术 。光数据库产品就好几十种,真是眼花缭乱:)
先说说几个概念:结构化和非结构化数据,关系型和非关系型数据库
简单而言,可以用二维表来表示的就是结构化数据(如,包含有不同字段的一条记录);相反,不方便用二维逻辑表来表现的数据,如文本、图片、视频、XML、HTML、图像和音频就是非结构化数据 。此外,字段可根据需要扩充,即字段数目不定的,可称为半结构化数据 。
关系型数据库就是由二维表及其之间的联系所组成的一个数据集 。可以这样理解,如果数据集(数据库)是关系型,那么数据一定是结构化的,相反如果数据是结构化,那么组成的数据集可能是关系型 。关系型数据库的最大特点就是事务的一致性 。传统的关系型数据库读写操作都是事务的,具有ACID(不展开讲)的特点,如典型的银行系统 。但是,在互联网应用中,一致性却不是显得那么重要:如张三看到的内容和李四看到同一内容更新不一致是可以容忍的,换句话说,两个人看到同一好友的数据更新的时间差那么几秒是可以容忍的 。因此,关系型数据库的最大特点在互联网时代已经不那么重要了 。
1、关系型数据库
数据库发展的早期,几乎都是集中式的关系型数据库的天下,如商业型数据库ORACLE、SQL Server、IBM DB2、Syba

    猜你喜欢