如何用亚马逊弹性MapReduce分析大数据

如题所述

举报该问题

推荐答案 2016-11-04

ããé¦åï¼æå¼Amazon Elastic MapReduceæ§å¶å°ãç¶åç¹å» Create Cluster ï¼å¨äºä¸ªæ¥éª¤ä¸å®æéç½®è®¾ç½®ã

ããç¬¬ä¸æ¥ï¼éç½®ä¸ä¸ªéç¾¤

ããå¨ Cluster name åæ®µä¸ï¼è¾å¥ä¸ä¸ªæè¿°æ§çåç§°ãå®å¯ä»¥æ¯éå¯ä¸çã

ããå¨Termination protection åæ®µä¸ï¼å¶é»è®¤å¼ä¸ºYesãè¿ä¸è®¾ç½®å¯ç¡®ä¿éç¾¤ä¸ä¼å ä¸ºæå¤æéè¯¯èå³éã

ããå¨Logging åæ®µä¸ï¼å¶é»è®¤å¼ä¸ºEnabledãæ¥å¿æ°æ®å°è¢«åéè³äºé©¬éS3ã

ããå¨Log folder S3 location åæ®µä¸ï¼è¯·ä»¥å¦ä¸æ ¼å¼è¾å¥åå¨æ¡¶åç§°åæä»¶å¤¹ä¿¡æ¯ï¼s3://<bucket name>/<folder>/ã

ããå¨Debugging åæ®µä¸ï¼å¶é»è®¤å¼ä¸ºEnabledã

ããTag é¨åæ¯å¯éçãä½ å¯ä»¥ä¸ºä½ çEMRéç¾¤æ·»å æå¤10ä¸ªæ ç¾ãå¨ä¸ä¸ªæ ç¾ä¸ï¼åæ¬äºä¸ä¸ªåºåå¤§å°åçé®å¼å¯¹ã

ããç¬¬äºæ¥ï¼è®¾ç½®è½¯ä»¶éç½®

ããå¨Hadoop distribution å¤éæ¡ä¸ï¼éæ©Amazon ä¸ºé»è®¤å¼ã

ããå¨ AMI version å¤éæ¡ä¸ï¼éæ© 2.4.2 ï¼Hadoop 1.0.3ï¼

ããå¨Application to be installed å¤éæ¡ä¸ï¼ä¿çéä¸Hive å deletePigã

ããç¬¬ä¸æ¥ï¼è®¾ç½®ç¡¬ä»¶éç½®

ããå¨ Network åæ®µä¸ï¼éæ©Launch into EC-2 Classicã

ããå¨EC2 Subnet åæ®µä¸ï¼éæ© No preferenceã

ããå¨MasterãCore ä»¥å Task åæ®µä¸ï¼é»è®¤EC2å®ä¾ç±»åä¸ºm1.smallãå¯¹äºä½å·¥ä½è´è½½çåºç¨ï¼ä½ å¯ä»¥ä¸ºææèç¹éæ©ä½¿ç¨å°å®ä¾ï¼å¯ç¡®ä¿éä½ä½ çä½¿ç¨ææ¬ï¼ãç¸åºå°ï¼Count
çé»è®¤å¼åå«ä¸º1ã 2ã 0ãåæ¶ï¼å¯¹äºææä¸ä¸ªåæ®µï¼ç¡®ä¿ä¸éä¸ Request Spot Instances ã

ããæ³¨æï¼20æ¯æ¯ä¸ªAWSå¸æ·çæå¤§èç¹æ°ãå¦æä½ è¿è¡äº2ä¸ªéç¾¤ï¼é£ä¹2ä¸ªéç¾¤è¿è¡çèç¹æ»æ°å¿é¡»ä¸º20æä»¥ä¸ãå¦æä½ ç¡®å®éè¦èç¹æ°è¶è¿20ï¼é£ä¹ä½ å¿é¡»æäº¤ä¸ä¸ªè¯·æ±ä»¥ä¾¿äºæé«ä½ çäºé©¬éEC2å®ä¾ä¸éã

ããç¬¬åæ¥ï¼è®¾ç½®å®å¨åè®¿é®éç½®

ããå¨EC2 key pair åæ®µä¸ï¼ä»åè¡¨ä¸éæ©ä¸ä¸ªäºé©¬éEC2å¯é¥å¯¹ãè¿ä¸è®¾ç½®å¯ä»¥è®©ä½ ä½¿ç¨Secure Shellï¼SSHï¼æ¥è¿æ¥ä¸»èç¹ã

ããå¨IAM user access åæ®µä¸ï¼å¶é»è®¤å¼ä¸º No other IAM usersã

ããå¨EC2 role å¤éæ¡ä¸ï¼å¶é»è®¤å¼ä¸º no roles foundã

ããå¨Bootstrap Actions é¨åï¼ä½ å¯ä»¥ä¸åä»»ä½æä½ã

ããç¬¬äºæ¥ï¼æå®éç¾¤åæ°

ããå¨Steps é¨åï¼ä»åè¡¨ä¸éæ©Hive Programï¼å¹¶ç¹å» Configure and addã

ããå¨Name åæ®µä¸ï¼å¶é»è®¤å¼ä¸ºHive Programã

ããå¨ Script s3 Location åæ®µä¸ï¼å¿éé¡¹ï¼ï¼ä»¥BucketName/path/ScriptNameçæ ¼å¼è¾å¥ç¸å³ä¿¡æ¯ï¼ä¾å¦
s3n://elasticmapreduce/samples/hive-ads/libs/model-buildã

ããå¨ Input s3 Location åæ®µä¸ï¼å¯éé¡¹ï¼ï¼ä»¥BucketName/pathçæ ¼å¼è¾å¥ç¸å³ä¿¡æ¯ï¼ä¾å¦
s3n://elasticmapreduce/samples/hive-ads/tablesãè¯¥è¾å¥å¼ä¼ä½ä¸ºåä¸ºINPUTçåæ°åéç»Hiveè
æ¬ç¨åºã

ããOutput S3 Location åæ®µï¼å¯éé¡¹ï¼ï¼ä»¥BucketName/pathçæ ¼å¼è¾å¥ç¸å³ä¿¡æ¯ï¼ä¾å¦
s3n://myawsbucket/hive-ads/output/2014-4-14ãè¯¥è¾å¥å¼ä¼ä½ä¸ºåä¸ºOUTPUTçåæ°åéç»Hiveèæ¬ç¨
åºã

ããå¨ Arguments åæ®µï¼è¾å¥ç¸å³ä¿¡æ¯ï¼å¦ - d LIBS=s3n://elasticreducemap/samples/hive-ads/libsãHIVEèæ¬ç¨åºéè¦é¢å¤çåºã

ããå¨ Action on Failure åæ®µä¸ï¼éæ© Continueãå¦æå½åæ¥éª¤å¤±è´¥ï¼å®å°ç»§ç»è³ä¸ä¸ä¸ªæ¥éª¤ã

ããå½ä½ å®æåï¼ç¹å»Addï¼ç¶åç¹å»Create Clusterãä½ å°ä¼çå°Summary ä¿¡æ¯ã

ããå¦ä¸ä¾ï¼å¨ä½ ç»§ç»æ¥è¯¢æä½ååæå¤§æ°æ®åï¼ä½ éè¦å¨ä¸»èç¹ä¸åå¤ä¸ä¸ªHIVEä¼è¯ã

ããä½ å°éè¦æ¯éäºåéåäºé©¬éS3æ¨é Impression å Click Log Filesãæ¯æ¬¡æ·»å ä¸ä¸ªæ¡ç®ï¼å°±ä¼åå®¢æ·æ¾ç¤ºä¸æ¡å¹¿åãæ¯æ¬¡æ·»å ä¸ä¸ªClick
Log Filesçæ¡ç®ï¼å®¢æ·ä¸æ¡å¹¿åãç±»ä¼¼äºSQLçæ¥è¯¢æä½ç®åäºå³èå®¢æ·ç¹å»æ°æ®åç¹å®å¹¿åçè¿ç¨ã

ããæ»ä¹ï¼åæå¤§æ°æ®çæä½³æ¹æ³å°±æ¯å¨Hadoopä¸è¿è¡Hiveï¼å¹¶ä½¿ç¨SQLæ¥è¯¢ä»¥ç®åæ¥å¿æ°æ®åæã

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/IR44QLGIQeR84G8RRFL.html

相似回答

大家正在搜