Видео: Hadoop дахь DataNode ба NameNode гэж юу вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Өгөгдлийн зангилаа дотор байгаа боол зангилаанууд HDFS . Дургүй NameNode , DataNode Энэ нь өндөр чанартай, өндөр хүртээмжтэй биш, өндөр өртөгтэй бус, өргөн хэрэглээний техник хангамж юм. The DataNode нь ext3 эсвэл ext4 локал файлд өгөгдлийг хадгалдаг блок сервер юм.
Нэмж дурдахад NameNode нь Hadoop дээр хэрхэн ажилладаг вэ?
NameNode зөвхөн мета өгөгдлийг хадгалдаг HDFS – файлын систем дэх бүх файлын лавлах мод бөгөөд кластер дээрх файлуудыг хянадаг. NameNode бодит өгөгдөл эсвэл өгөгдлийн багцыг хадгалдаггүй. Өгөгдөл нь өөрөө DataNodes-д хадгалагддаг. NameNode нь бүтэлгүйтлийн ганц цэг юм Hadoop бөөгнөрөл.
NameNode RPC гэж юу вэ? Hadoop-д NameNode нь өөрийн нэрийн талбарт HDFS үйлдлүүдийг зохицуулдаг нэг машин юм. Эдгээр үйлдлүүд нь блокийн байршлыг авах, лавлах жагсаалт гаргах, файл үүсгэх зэрэг орно. The NameNode байдлаар HDFS үйлдлийг хүлээн авдаг RPC дуудаж, уншигч урсгалаар гүйцэтгэхийн тулд FIFO дуудлагын дараалалд оруулдаг.
Үүнтэй холбогдуулан Hadoop дахь зангилаа гэж юу вэ?
А hadoop дахь зангилаа зүгээр л боловсруулах, хадгалахад ашиглаж болох компьютер гэсэн үг. Хоёр төрөл байдаг hadoop дахь зангилаа Нэр зангилаа болон өгөгдөл зангилаа . Үүнийг a гэж нэрлэдэг зангилаа Учир нь эдгээр бүх компьютерууд хоорондоо холбоотой байдаг. NameNode-ийг Мастер гэж нэрлэдэг зангилаа.
Hadoop дахь хоёрдогч NameNode гэж юу вэ?
hadoop дахь хоёрдогч NameNode нь тусгайлан зориулсан зангилаа юм HDFS үндсэн үүрэг нь файлын системийн мета өгөгдлийн хяналтын цэгүүдийг авах кластер нэрийн зангилаа . Энэ нь нөөц биш юм нэрийн зангилаа . Зүгээр л шалган нэвтрүүлэх цэгүүд нэрийн зангилаа файлын системийн нэрийн орон зай.
Зөвлөмж болгож буй:
Apache Hadoop дахь хоёрдогч Namenode гэж юу вэ?
Hadoop дахь хоёрдогч NameNode нь HDFS кластерт тусгайлан зориулсан зангилаа бөгөөд үндсэн үүрэг нь namenode дээрх файлын системийн мета өгөгдлийн хяналтын цэгүүдийг авах явдал юм. Энэ нь нөөц нэрийн зангилаа биш юм. Энэ нь зөвхөн namenode-ийн файлын системийн нэрийн орон зайг шалгадаг
Hadoop дахь HDP гэж юу вэ?
Hortonworks Data Platform (HDP) нь төвлөрсөн архитектур (YARN) дээр суурилсан аюулгүй байдлын баялаг, аж ахуйн нэгжид бэлэн, нээлттэй эхийн Apache Hadoop түгээлт юм. HDP нь тайван байх үеийн өгөгдлийн хэрэгцээг хангаж, хэрэглэгчийн бодит цагийн хэрэглээний програмуудыг идэвхжүүлж, шийдвэр гаргах болон инновацийг хурдасгахад тусалдаг хүчирхэг аналитикийг хүргэдэг
Hadoop дахь хүчил гэж юу вэ?
ACID гэдэг нь Atomicity, Consistency, Consistency, Insolation, Durability гэсэн үгийн товчлол юм. Тогтвортой байдал нь аливаа гүйлгээ нь мэдээллийн санг нэг хүчинтэй мужаас нөгөө муж руу авчрах болно. Тусгаарлах нь гүйлгээ бүр бие биенээсээ хараат бус байх ёстой, өөрөөр хэлбэл нэг гүйлгээ нөгөөд нөлөөлөх ёсгүй
Hadoop дахь өгөгдлийн шугам гэж юу вэ?
Өгөгдлийн удам угсаа. Өгөгдлийн удам угсаа нь өгөгдлийн амьдралын мөчлөг ба төгсгөл хүртэлх урсгал гэж тодорхойлж болно. Мэдээллийн удам угсаа нь компаниудад бизнесийн тодорхой мэдээллийн эх сурвалжийг хянах боломжийг олгодог бөгөөд энэ нь алдааг хянах, үйл явц дахь өөрчлөлтийг хэрэгжүүлэх, цаг хугацаа хэмнэхийн тулд системийн шилжилтийг хэрэгжүүлэх боломжийг олгодог
Hadoop дахь овоолгын хэмжээ гэж юу вэ?
HADOOP_HEAPSIZE нь HDFS, YARN, MapReduce зэрэг Hadoop төслийн бүх серверүүдэд JVM овоолгын хэмжээг тохируулдаг. HADOOP_HEAPSIZE нь JVM-д хамгийн их санах ой (Xmx) аргумент болгон дамжуулагдсан бүхэл тоо юм. Жишээ нь: HADOOP_HEAPSIZE=1024