Видео: Amazon Elastic MapReduce-ийн ард ямар өгөгдөл боловсруулах хөдөлгүүр байдаг вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Amazon EMR Apache Hadoop-ийг түгээлт болгон ашигладаг өгөгдөл боловсруулах хөдөлгүүр . Hadoop бол нээлттэй эхийн Java програм хангамжийн хүрээ бөгөөд дэмждэг өгөгдөл -том кластерууд дээр ажилладаг эрчимтэй тархсан програмууд - ийн барааны техник хангамж.
Түүнээс гадна Amazon Elastic MapReduce гэж юу вэ?
Amazon Elastic MapReduce ( EMR ) нь Amazon Web Services ( AWS ) том өгөгдөл боловсруулах, дүн шинжилгээ хийх хэрэгсэл. Amazon EMR виртуал серверүүдийн Hadoop кластер дээр том өгөгдлийг боловсруулдаг Амазон уян харимхай Тооцоолох үүл ( EC2 ) ба Амазон Энгийн хадгалах үйлчилгээ ( S3 ).
Цаашилбал, Amazon EMR бүрэн удирддаг уу? Энэ бол бүрэн удирддаг Дата нуурын үйлчилгээ нь өгөгдөл хадгалах санг тооцоолох нөөцөөс салгаж, оронд нь тооцооллын кластеруудыг өргөтгөх боломжтой, хэрэгцээний дагуу ашиглах боломжтой болгодог бөгөөд олон кластерууд нэг өгөгдлийн багцад нэгэн зэрэг хандах боломжийг агуулдаг.
AWS EMR хэрхэн ажилладаг вэ?
Ерөнхийдөө мэдээллийг боловсруулахдаа Amazon EMR , оролт нь таны сонгосон үндсэн файлын системд файл хэлбэрээр хадгалагдсан өгөгдөл юм Амазон S3 эсвэл HDFS. Энэ өгөгдөл нь боловсруулалтын дарааллаар нэг алхамаас нөгөөд шилждэг. Эцсийн алхам нь гаралтын өгөгдлийг тодорхой байршилд бичдэг Амазон S3 хувин.
ec2 ба EMR хоёрын ялгаа юу вэ?
Дургүй EMR , EC2 боол зангилаануудыг үндсэн болон ажлын зангилаа гэж ангилдаггүй. Энэ нь зангилаа устгагдсан/алдагдсан тохиолдолд HDFS өгөгдлийг алдах эрсдэлийг нэмэгдүүлдэг. EC2 s3 дээрх өгөгдөлд хандахын тулд Apache номын сангуудыг (s3a) ашигладаг. Нөгөө талаар, EMR s3-д илүү хурдан хандахын тулд AWS өмчийн кодыг ашигладаг.
Зөвлөмж болгож буй:
Бүлгийн өгөгдөл болон бүлэггүй өгөгдөл хоёрын хооронд ямар ялгаа байдаг вэ?
Аль аль нь өгөгдлийн ашигтай хэлбэр боловч тэдгээрийн ялгаа нь бүлэггүй өгөгдөл нь түүхий өгөгдөл юм. Энэ нь дөнгөж цуглуулсан боловч ямар ч бүлэг, ангид ангилаагүй гэсэн үг юм. Нөгөөтэйгүүр, бүлэглэсэн өгөгдөл нь түүхий өгөгдлөөс бүлэг болгон зохион байгуулагдсан өгөгдөл юм
Мэдээлэл боловсруулах мөчлөгийн ямар үе шатууд байдаг вэ?
Компьютер ба компьютерийн боловсруулалтын хүрээнд мэдээлэл боловсруулах мөчлөг нь оролт, боловсруулалт, гаралт, хадгалалт (IPOS) гэсэн дөрвөн үе шаттай
1980-аад оны үед үг хэллэгээс гадна алдартай байсан өөр ямар хоёр үг боловсруулах программ хангамж байдаг вэ?
Adobe InCopy. Corel WordPerfect (9.0 хувилбар хүртэл) Hangul. Ичитаро. Kingsoft зохиолч. Microsoft Word. Скривенер. StarOffice Writer
Цахим мэдээлэл боловсруулах ямар төрлүүд байдаг вэ?
Шинжлэх ухааны болон арилжааны боловсруулалтын үндсэн чиглэлүүдийн хүрээнд өгөгдөлд боловсруулах үе шатуудыг хэрэгжүүлэхэд янз бүрийн аргыг ашигладаг. Мэдээлэл боловсруулах гурван үндсэн төрлийг бид автомат/гарын авлага, багц болон бодит цагийн өгөгдөл боловсруулах талаар хэлэлцэх болно
Өгөгдөл олборлолтод ямар төрлийн өгөгдөл байдаг вэ?
Ямар төрлийн өгөгдөл олборлож болохыг ярилцъя: Хавтгай файлууд. Харилцааны мэдээллийн сан. Өгөгдлийн агуулах. Гүйлгээний мэдээллийн сан. Мультимедиа мэдээллийн сан. Орон зайн мэдээллийн сан. Цагийн цуврал мэдээллийн сан. World Wide Web(WWW)