AWS MapReduce гэж юу вэ?
AWS MapReduce гэж юу вэ?

Видео: AWS MapReduce гэж юу вэ?

Видео: AWS MapReduce гэж юу вэ?
Видео: Traceroute (tracert) Explained - Network Troubleshooting 2024, Арванхоёрдугаар сар
Anonim

Амазон уян харимхай MapReduce (EMR) нь Amazon Web Services ( AWS ) том өгөгдөл боловсруулах, дүн шинжилгээ хийх хэрэгсэл. Amazon EMR нь Amazon Elastic Compute Cloud (EC2) болон Amazon Simple Storage Service (S3) дээрх виртуал серверүүдийн Hadoop кластерт том өгөгдлийг боловсруулдаг.

Ийм байдлаар AWS EMR хэрхэн ажилладаг вэ?

Энэ үйлчилгээ нь нэг мастер болон бусад олон зангилаанаас бүрдэх Amazon EC2-ийн хэрэглэгчийн тодорхойлсон тооны тооны инстанцуудыг эхлүүлдэг. Амазон EMR Эдгээр тохиолдлууд дээр Hadoop программ хангамжийг ажиллуулдаг. Мастер зангилаа нь оролтын өгөгдлийг блок болгон хувааж, блокуудын боловсруулалтыг бусад зангилаа руу хуваарилдаг.

Дээрхээс гадна ec2 ба EMR хоёрын ялгаа юу вэ? Дургүй EMR , EC2 боол зангилаануудыг үндсэн болон ажлын зангилаа гэж ангилдаггүй. Энэ нь зангилаа устгагдсан/алдагдсан тохиолдолд HDFS өгөгдлийг алдах эрсдэлийг нэмэгдүүлдэг. EC2 s3 дээрх өгөгдөлд хандахын тулд Apache номын сангуудыг (s3a) ашигладаг. Нөгөө талаар, EMR s3-д илүү хурдан хандахын тулд AWS өмчийн кодыг ашигладаг.

Үүнээс гадна, AWS EMR нь бүрэн удирддаг уу?

Амазон Уян хатан газрын зураг бууруулах ( EMR ) нь бүрэн удирддаг Hadoop болон Spark платформоос Амазон Вэб үйлчилгээ ( AWS ). -тай EMR , AWS Үйлчлүүлэгчид том өгөгдлийн ачааллыг боловсруулахын тулд олон зангилаа Hadoop кластеруудыг хурдан эргүүлэх боломжтой.

AWS нь Hadoop ашигладаг уу?

Амазон Вэб үйлчилгээ ашигладаг нээлттэй эхийн Apache Hadoop мэдээлэл их шаарддаг ажлуудыг гүйцэтгэхийн тулд их хэмжээний тооцоолох хүчин чадалд хандахад хялбар болгох үүднээс тархсан тооцоолох технологи. Hadoop , Google-ийн MapReduce-ийн нээлттэй эхийн хувилбарыг Yahoo, Facebook зэрэг компаниуд аль хэдийн ашиглаж байна.

Зөвлөмж болгож буй: