2013年12月23日星期一

基于异构arm硬件的Hadoop集群测试

本邮件内容由第三方提供,如果您不想继续收到该邮件,可 点此退订
基于异构arm硬件的Hadoop集群测试  阅读原文»

基于异构arm硬件的Hadoop集群测试

3月份的时候做了单机版的hadoop on arm的测试,最近又买了一个新的arm板子,就考虑把他们串起来组一个hadoop集群。而且由于产品更新换代的问题,硬件上是异构的。

基于arm架构单片机的hadoop服务器尝试

namenode是cubieboard一代,采用单核arm v7架构,1G内存,4G板载flash ROM

datanode采用cubietruck,双核armv7,2G内存,8G板载Flash ROM,挂了一个80G的2.5寸磁盘。

两个主板的操作系统均采用ubuntu server。

nn的操作系统装在SD卡上,把nand分区格式化掉当存储,所谓nand就是flash ROM。

dn操作系统直接刷在nand上,无SD卡,挂载一块硬盘当存储。

怎么把linux安装到nand上这次先不讲,以后单独说。

  linaro@namenode:~$ df -h  Filesystem      Size  Used Avail Use% Mounted on  /dev/mmcblk0p2  1.8G  1.1G  600M  66% /  devtmpfs        408M  4.0K  408M   1% /dev  none            408M  128K  408M   1% /tmp  none             82M  164K   82M   1% /run  none            408M     0  408M   0% /var/tmp  none            5.0M     0  5.0M   0% /run/lock  none            408M     0  408M   0% /run/shm  none            100M     0  100M   0% /run/user  /dev/nand       3.8G   75M  3.5G   3% /opt  
  linaro@datanode-01:~$ df -h  Filesystem      Size  Used Avail Use% Mounted on  /dev/root       2.0G  1.3G  648M  67% /  devtmpfs        913M  4.0K  913M   1% /dev  none            4.0K     0  4.0K   0% /sys/fs/cgroup  none            183M  224K  183M   1% /run  none            5.0M     0  5.0M   0% /run/lock  none            913M     0  913M   0% /run/shm  none            100M     0  100M   0% /run/user  /dev/nandc      5.1G  139M  4.7G   3% /opt  /dev/sda1        74G  180M   70G   1% /data  linaro@datanode-01:~$  

dd测试一下磁盘性能,nand读写可以忽略不计,flash ROM上读写数据的效率可以用惨不忍睹来性能。写数据只有每秒可怜的5M,读数据每秒7M,逆天的慢。

如果使用磁盘的性能差不多,就可以拼凑出一个超级丝的Hadoop集群来用。

写数据性能,没有想象中的快,不过作为一个N年前的80G 2.5寸,5400转的SATA盘,这个成绩不错了。43.2MB/s

  linaro@datanode-01:~$ sudo time dd if=/dev/zero of=/data/1GB bs=4096 count=250000  250000+0 records in  250000+0 records out  1024000000 bytes (1.0 GB) copied, 23.7274 s, 43.2 MB/s  0.28user 11.04system 0:23.73elapsed 47%CPU (0avgtext+0avgdata 776maxresident)k  8inputs+2000000outputs (0major+252minor)pagefaults 0swaps  

读数据性能超乎意料的好,惊了。338MB/s。

  linaro@datanode-01:~$ sudo time dd if=/data/1GB of=/dev/null bs=4096 count=250000  250000+0 records in  250000+0 records out  1024000000 bytes (1.0 GB) copied, 3.02673 s, 338 MB/s  0.19user 2.80system 0:03.03elapsed 98%CPU (0avgtext+0avgdata 776maxresident)k  0inputs+0outputs (0major+252minor)pagefaults 0swaps  

如果是这样,那么当成Hadoop服务器肯定是没啥大问题的,本来hadoop就是做一次写入多次读取来用的,写入慢一些不怕,只要读取够快就行了。哪怕做hbase的在线服务也可以将就。

有图有真相


黑色为cubieboard一代,红色板卡为cubietruck,CT下面是80G硬盘

202945349.jpg

供电和网络

202949885.jpg

202954822.jpg

硬盘连接

202958936.jpg

CPU info,datanode+tasktracker双核处理器

203003946.jpg

Namenode单核处理器

203008987.jpg

Namenode操作系统及cpu架构

203016259.jpg

Datanode操作系统及CPU架构

203023380.jpg

Pi冒烟测试,至少比我之前单片做Hadoop测试要快,如果把nand完全不当存储,全释放出来的话,可能还要更快。

203030453.jpg

namenode上nand当存储使。

203036276.jpg

datanode上挂载一个nand分区和硬盘共同存储数据。

203042216.jpg

两台tasktracker

203053881.jpg

两台datanode

203059227.jpg

总容量

203104922.jpg


arm因为现在只有32位CPU,所以处理能力很有限,但很高兴的是,这并不影响磁盘性能。我们至少可以组建一个基于arm的hadoop存储集群,作为冷数据的存储和备份使用。或者组建一个对线上提供查询服务的HBASE集群。这样做的主要好处是成本非常低廉,并且易于维护。

算笔账,一块arm板子几百块钱,去掉作为开发板的那些不必要外设,诸如wifi,火线,HDMI,蓝牙,GPIO口,SD卡口的话,还能便宜。1TB的2.5寸7200转sata盘淘宝售价不到500。1T存储的总成本不到1

项目成长记(二) ―― LNMP环境优化  阅读原文»

每日博报 精彩不止一点关闭

用户名:村长爱技术
文章数:17
评论数:3
访问量:769
无忧币:218
博客积分:262
博客等级:2
注册日期:2013-12-18

项目成长记(二) ―― LNMP环境优化

才过去短短的一个礼拜,网站就快到10万pv了,真实佩服公司的营销手段啊,网站越来越慢了,这下老大可不高兴了,对我说:"村长啊,咱们这速度用户体验不咋地啊,过两天就没人来了,公司还指望这个赚钱呢,你赶紧'敏捷'一下!",我也着急啊,指望项目赚钱公司给我涨薪呢,这要是服务挂了娶媳妇的钱都没了,于是赶紧进行优化。

1、Nginx优化

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
#nginx推荐配置文件
worker_processes 8; #CPU多少核就写多少,利用cpu多核的优势
error_log logs/error.log warn; #随时记录错误
pid logs/nginx.pid;
worker_rlimit_nofile 51200;
events {
use epoll;
worker_connections 51200; #允许更多的请求量
}
http {
include mime.types;
default_type application/octet-stream;

阅读更多内容

没有评论:

发表评论