Спарк нэвтрүүлэг гэж юу вэ?
Спарк нэвтрүүлэг гэж юу вэ?

Видео: Спарк нэвтрүүлэг гэж юу вэ?

Видео: Спарк нэвтрүүлэг гэж юу вэ?
Видео: 🧬 Генетикийн салбарын хамгийн том нээлт - КРИСПР гэж юу вэ? 2024, Арваннэгдүгээр
Anonim

Нэвтрүүлэг Apache дахь хувьсагч Оч нь зөвхөн уншихад зориулагдсан хувьсагчдыг гүйцэтгэгчид хуваалцах механизм юм. Үгүй нэвтрүүлэг хувьсагчдаас эдгээр хувьсагчийг хувиргах, үйлдэл болгонд гүйцэтгэгч бүрт хүргэх бөгөөд энэ нь сүлжээний ачаалал үүсгэж болзошгүй.

Үүнтэй адил хүмүүс би хэзээ оч цацах ёстой вэ гэж асуудаг.

Нэвтрүүлэг хувьсагчдыг ихэвчлэн олон үе шат дамжсан ажлуудад ижил өгөгдөл шаардлагатай үед эсвэл цуваагүй хэлбэрээр өгөгдлийг кэшлэх шаардлагатай үед ашигладаг. Нэвтрүүлэг V хувьсагчийг ашиглан SparkContext-ийг дуудаж хувьсагчдыг үүсгэнэ.

Түүнчлэн, spark дахь аккумлятор ба өргөн нэвтрүүлгийн хувьсагч гэж юу вэ? Оч хоёр төрлийн хуваалцахыг дэмждэг хувьсагч : өргөн нэвтрүүлгийн хувьсагчид , бүх зангилааны санах ой дахь утгыг кэш хийхэд ашиглаж болох ба аккумляторууд , аль нь юм хувьсагч тоологч, нийлбэр гэх мэт зөвхөн "нэмдэг".

Үүнийг авч үзвэл оч аккумлятор гэж юу вэ?

Аккумляторууд Эдгээр нь зөвхөн ассоциатив үйлдлээр "нэмэгддэг" хувьсагчууд бөгөөд иймээс зэрэгцэн үр дүнтэйгээр дэмжигдэх боломжтой. Тэдгээрийг тоолуур (MapReduce дээрх шиг) эсвэл нийлбэрийг хэрэгжүүлэхэд ашиглаж болно. Оч угаасаа дэмждэг аккумляторууд тоон төрлүүд болон програмистууд шинэ төрлүүдэд дэмжлэг нэмэх боломжтой.

Би spark дахь өргөн нэвтрүүлгийн хувьсагчаа хэрхэн шинэчлэх вэ?

  1. Лавлагааны өгөгдлийн хайлтыг forEachPartition эсвэл forEachRdd руу шилжүүлснээр энэ нь бүхэлдээ ажилчид дээр байх болно.
  2. Refdata өөрчлөгдөх бүрт Spark контекстийг шинэ өргөн нэвтрүүлгийн хувьсагчаар дахин эхлүүлнэ үү.

Зөвлөмж болгож буй: