Hadoop дээр өгөгдлийн локалчлал хэрхэн хийгддэг вэ?
Hadoop дээр өгөгдлийн локалчлал хэрхэн хийгддэг вэ?

Видео: Hadoop дээр өгөгдлийн локалчлал хэрхэн хийгддэг вэ?

Видео: Hadoop дээр өгөгдлийн локалчлал хэрхэн хийгддэг вэ?
Видео: Hadoop 5 минутын дотор | Hadoop гэж юу вэ? | Hadoop-ийн танилцуулга | Hadoop тайлбарласан |Хялбар сургах 2024, May
Anonim

Өгөгдлийн нутагшуулалт in Hadoop . Ихэнх үгс 5 лак ба түүнээс дээш удаа давтагдсан Wordcount жишээг авч үзье. Энэ тохиолдолд Mapper-ийн үе шат дууссаны дараа зураглагчийн гаралт бүр 5 лакын хязгаарт үгтэй байх болно. Mapper-ийн гаралтыг LFS-д хадгалах энэхүү бүрэн үйл явцыг гэж нэрлэдэг Өгөгдлийн нутагшуулах.

Үүнийг харгалзан үзэхэд Hadoop дахь өгөгдлийг нутагшуулах гэж юу вэ?

-ийн тухай ойлголт Өгөгдөл дахь нутаг дэвсгэр Hadoop өгөгдөл дахь нутаг дэвсгэр MapReduce Энэ нь тооцооллыг бодит байдалд ойртуулах чадварыг хэлнэ өгөгдөл том шилжихийн оронд зангилаа дээр байрладаг өгөгдөл тооцоололд. Энэ нь сүлжээний түгжрэлийг багасгаж, системийн нийт нэвтрүүлэх чадварыг нэмэгдүүлдэг.

Мөн том өгөгдөл хэрхэн хадгалагддаг вэ? Ихэнх хүмүүс HDFS буюу Hadoop Distributed File System-ийг Hadoop-той автоматаар холбодог өгөгдөл агуулахууд. HDFS нь мэдээллийг жижиг блокуудаас бүрдсэн кластерт хадгалдаг. Эдгээр блокууд нь хадгалсан газар дээр нь физик хадгалах дотоод диск хөтчүүд гэх мэт нэгжүүд.

Тэгвэл Hadoop-д өгөгдөл хэрхэн хадгалагддаг вэ?

Дээр Hadoop кластер, the өгөгдөл HDFS доторх болон MapReduce систем нь кластер дахь бүх машин дээр байрладаг. Өгөгдөл байна хадгалсан in өгөгдөл DataNodes дээрх блокууд. HDFS эдгээрийг хуулбарладаг өгөгдөл блокууд, ихэвчлэн 128MB хэмжээтэй бөгөөд тэдгээрийг хуваарилдаг тул кластерийн олон зангилаанд хуулбарлагддаг.

HDFS-д файлууд хэрхэн хадгалагддаг вэ?

HDFS илчилдэг а файл системийн нэрийн орон зай бөгөөд хэрэглэгчийн өгөгдөл байх боломжийг олгодог хадгалсан in файлууд . Дотооддоо, А файл нэг буюу хэд хэдэн блокуудад хуваагдсан бөгөөд эдгээр блокууд нь байна хадгалсан DataNodes-ийн багцад. NameNode нь ажилладаг файл нээх, хаах, нэрийг өөрчлөх зэрэг системийн нэрийн орон зайн үйлдлүүд файлууд болон лавлахууд.

Зөвлөмж болгож буй: