Видео: Hadoop дахь дата нуур гэж юу вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
А Hadoop мэдээллийн нуур нь өгөгдөл нэг буюу хэд хэдэн хэсгээс бүрдсэн удирдлагын платформ Hadoop кластерууд. Энэ нь үндсэндээ хамааралгүй зүйлсийг боловсруулах, хадгалахад ашиглагддаг өгөгдөл лог файлууд, интернет товшилтын бичлэгүүд, мэдрэгч гэх мэт өгөгдөл , JSON объект, зураг, нийгмийн сүлжээний нийтлэл.
Үүнтэй холбогдуулан мэдээллийн агуулах, дата нуур хоёрын ялгаа юу вэ?
Өгөгдлийн нуурууд болон өгөгдөл агуулах нь хоёулаа том агуулахыг хадгалахад өргөн хэрэглэгддэг өгөгдөл , гэхдээ тэдгээр нь солигддог нэр томъёо биш юм. А мэдээллийн нуур түүхий эдийн асар том сан юм өгөгдөл , зорилго нь хараахан тодорхойлогдоогүй байна. А өгөгдлийн агуулах бүтэцтэй, шүүсэн агуулах юм өгөгдөл тодорхой зорилгоор аль хэдийн боловсруулсан байна.
Нэмж хэлэхэд дата нуурын архитектур гэж юу вэ? А Дата нуур их хэмжээний бүтэцтэй, хагас бүтэцтэй, бүтэцгүй мэдээллийг хадгалах боломжтой хадгалах сан юм. өгөгдөл . Шаталсан Dataware байшингаас ялгаатай нь хаана өгөгдөл Файл болон хавтас дотор хадгалагддаг, Дата нуур байртай архитектур.
Үүнтэй холбогдуулан дата нуур гэж юуг хэлэх вэ?
А мэдээллийн нуур асар их хэмжээний түүхий эдийг хадгалдаг агуулах юм өгөгдөл шаардлагатай болтол нь эх форматаар. Шатлалтай байхад өгөгдөл агуулахын дэлгүүрүүд өгөгдөл файл эсвэл хавтас дотор, a мэдээллийн нуур хадгалахын тулд хавтгай архитектурыг ашигладаг өгөгдөл . Нөхцөл мэдээллийн нуур нь ихэвчлэн Hadoop хандалттай объект хадгалахтай холбоотой байдаг.
Elasticsearch нь мэдээллийн нуур мөн үү?
А мэдээллийн нуур бол зүгээр л машинаа тавих газар юм өгөгдөл Танд хэрэгтэй болтол энэ нь HDFS (хамгийн түгээмэл), объект хадгалах, NAS хайрцаг эсвэл бусад зүйлийг багтааж болно. Үндсэндээ, Elasticsearch индексжүүлэх хэрэгсэл юм өгөгдөл , хадгалах зориулалттай биш өгөгдөл өөрөө.
Зөвлөмж болгож буй:
Apache Hadoop дахь хоёрдогч Namenode гэж юу вэ?
Hadoop дахь хоёрдогч NameNode нь HDFS кластерт тусгайлан зориулсан зангилаа бөгөөд үндсэн үүрэг нь namenode дээрх файлын системийн мета өгөгдлийн хяналтын цэгүүдийг авах явдал юм. Энэ нь нөөц нэрийн зангилаа биш юм. Энэ нь зөвхөн namenode-ийн файлын системийн нэрийн орон зайг шалгадаг
Hadoop дахь HDP гэж юу вэ?
Hortonworks Data Platform (HDP) нь төвлөрсөн архитектур (YARN) дээр суурилсан аюулгүй байдлын баялаг, аж ахуйн нэгжид бэлэн, нээлттэй эхийн Apache Hadoop түгээлт юм. HDP нь тайван байх үеийн өгөгдлийн хэрэгцээг хангаж, хэрэглэгчийн бодит цагийн хэрэглээний програмуудыг идэвхжүүлж, шийдвэр гаргах болон инновацийг хурдасгахад тусалдаг хүчирхэг аналитикийг хүргэдэг
Hadoop дахь хүчил гэж юу вэ?
ACID гэдэг нь Atomicity, Consistency, Consistency, Insolation, Durability гэсэн үгийн товчлол юм. Тогтвортой байдал нь аливаа гүйлгээ нь мэдээллийн санг нэг хүчинтэй мужаас нөгөө муж руу авчрах болно. Тусгаарлах нь гүйлгээ бүр бие биенээсээ хараат бус байх ёстой, өөрөөр хэлбэл нэг гүйлгээ нөгөөд нөлөөлөх ёсгүй
Дата олборлолт гэж юу вэ, дата олборлолт гэж юу вэ?
Өгөгдлийн олборлолт нь ямар нэгэн таамаглалгүйгээр хийгддэг тул өгөгдлөөс гарч буй мэдээлэл нь байгууллагын тодорхой асуултуудад хариулах зорилготой биш юм. Өгөгдөл олборлолт биш: Өгөгдлийн олборлолтын зорилго нь их хэмжээний өгөгдлөөс хэв маяг, мэдлэгийг гаргаж авах явдал бөгөөд өгөгдлийг өөрөө олборлох (олборлох) биш юм
AWS мэдээллийн нуур гэж юу вэ?
Дата нуур нь компаниудад олон төрлийн эх сурвалжаас олон төрлийн өгөгдлийн төрлийг удирдах, бүтэцлэгдсэн болон бүтэцгүй эдгээр өгөгдлийг төвлөрсөн агуулахад хадгалах боломжийг олгодог тул өгөгдлийг хадгалах, шинжлэх шинэ бөгөөд улам бүр түгээмэл арга юм