大数据分析领市场

网站建设知识 phpacg 2年前 (2018-04-24) 100次浏览 0个评论

一、实质是什么?

假设拔下电源,一块块的把一体机肢解开,你能够会发现(我没这么干过)它有两三个框加上几个独立的刀片效劳器,框里有很多插板,每片插板上有CPU、内存,也许也有硬盘。你能够会觉得这不就是把十几个刀片整合在一同共享电源和网络模块嘛?我有段时间就是这么以为的。

我也曾研讨过怎样应用昂贵的硬件设备组成计算才干超强的系统,至少要处置这两个效果:

义务联系。以搜索引擎为例,它每时每刻都要派出成百上千万只爬虫去抓取整个互联网,每只爬虫领一小片义务,确保义务之间不抵触、义务的聚合掩盖完整、每小片义务要分配合理的冗余资源,还要思索对义务进度的跟踪管理。再以大数据剖析为例,它的每个剖析义务,要被合理的分散到每一片数据单元。假定某个统计查询要用到1T的数据,数据分散在100个刀片上,每个刀片处置10G数据,那么相应的统计SQL,要依据每个刀片的数据散布停止重写,必要时还要分层计算,并不是复杂的改改where条件就可以的。这进程中也许会遇到新效果,比如where条件里包括子查询,而且子查询的数据量也十分大,假定子查询从1T的原始数据中查出了0.7T,这暂时数据该如何处置呢?是放在其中一个节点上停止计算还是再次打散到每个节点上?假设每个义务单元无法做到完全独立、无法防止从其他单元协调数据,如何停止单元件的通讯和数据交流呢?

数据整合。把每个单元的计算结果整合在一同,停止必要的再加工,比如排序、去重等,构成最终的结果。有能够你的系统在上一条SQL执行完毕之前就提交了下一条SQL,当系统末尾收到反应结果的时分,如何识别这些系统的反应属于那一个义务?假设某个计算单元出现错误,系统如何检测到错误并及时布置其他单元补做呢?

这些还不包括Cache、通讯、效率、质量,都是大规模杀伤脑细胞的效果。

而关于一体机,一旦插上电,这些效果都处置了。

所以大数据一体机实质上不只仅是一堆硬件,而是软硬一体化的通用大数据系统。

二、真的有市场吗?

有。在大数据时代,市场需求这种产品。相关于传统系统,一体机的效率和质量确实高很多倍。

固然,业界买得起一体机的主,家里一定有有数等着淘汰的刀片和PC效劳器。

假设用某些散布式数据库+一堆PC效劳器、假设用相似Google File System/Hadoop的开源系统+一堆PC效劳器,确实有能够完成一些大数据处置功用,但是,

他们中绝大局部没有搞得定这些复杂系统并提供继续运维保证的人才。

他们中绝大局部没有时间和精神专门研发牢靠并高效的通用型大数据处置系统。

一体机比一堆PC效劳器更省电、省空间、省网络设备、走线复杂等等。

大数据一体机带来的效率和质量提升是很清楚的,而且扩展空间很大,封装了很多复杂技术,可以说门槛很高、前景宽广。

三、oracle的exadata似乎全球销量并不高

要真正压服用户掏钱,确实十分困难。关于习气了自己组装电脑下载电影看的用户,要怎样压服他扔掉耗资庞大的电脑、买下整座电影院呢?

四、兼容多种数据库,可以到达从O向非O数据库平滑过渡的技术含量很高吗?

假设在功用、质量、动摇性方面没有缩水的话,技术含量确实十分十分高,毕竟各种数据库的优化方式是不一样的。但是“多种”不见得是“很多种”,也不见得样样都精吧。假设用Oracle数据库,能够没有谁能和Oracle竞争;但是Oracle的强项是OLTP,关于大数据技术,普通以为是OLAP类型义务,Oracle自身并没有数据库技术优势。这也许是去O的一个技术方面的优势所在。但是别忘了,Exadata的刀片以及效劳器技术可是出自SUN的;而且在大数据一体机的架构中,数据团圆化之后使Oracle在较小数据单元上得以继续发扬它的优势。

五、如今国际很多厂商喊着去IOE和基础架构国产化的口号一窝蜂推出所谓的“大数据一体机”

外货有真金,水货也不少。吵吵民族主义,不如做好个把真实案例。只需在软硬一体这个概念上没什么过失,国产一体机也是有能够出精品的。由于技术虽然复杂,却没什么特别尖端的效果。听说浪潮和华为也都在做,他们在软硬件方面都很有实力,我置信他们确实能做出不错的产品,但需求市场机遇。

喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址