Паркетан өгөгдлийн формат гэж юу вэ?
Паркетан өгөгдлийн формат гэж юу вэ?

Видео: Паркетан өгөгдлийн формат гэж юу вэ?

Видео: Паркетан өгөгдлийн формат гэж юу вэ?
Видео: Жиги Проеттид хүндэтгэл үзүүлэв Тэр зүрхний шигдээсээр өвдөж нас барав: тэр 80 хүрэх байсан! 2024, May
Anonim

Апачи Паркет нь үнэ төлбөргүй, нээлттэй эхийн баганад чиглэсэн өгөгдөл хадгалах формат Apache Hadoop экосистемийн. Энэ нь ихэнхтэй нийцдэг өгөгдөл Hadoop орчинд боловсруулах хүрээ. Энэ нь үр дүнтэй байдлыг хангадаг өгөгдөл нарийн төвөгтэй зохицуулах сайжруулсан гүйцэтгэл бүхий шахалт болон кодчилолын схемүүд өгөгдөл Бөөнөөр нь.

Зүгээр л, паркет файлын формат гэж юу вэ?

Паркет , нээлттэй эх сурвалж файлын формат Hadoop-ийн хувьд. Паркет үүрлэсэн өгөгдлийн бүтцийг хавтгай баганад хадгалдаг формат . Мэдээллийг мөр рүү чиглэсэн аргаар хадгалдаг уламжлалт аргатай харьцуулахад, паркет хадгалалт болон гүйцэтгэлийн хувьд илүү үр дүнтэй байдаг.

Цаашилбал, паркетыг юунд ашигладаг вэ? Паркет нь Hadoop экосистемийн аливаа төсөлд ашиглах боломжтой нээлттэй эхийн файлын формат юм. Апачи Паркет Энэ нь CSV эсвэл TSV файлууд зэрэг мөр дээр суурилсан файлуудтай харьцуулахад үр ашигтай, гүйцэтгэлтэй хавтгай багана хэлбэрийн өгөгдөлд зориулагдсан.

Нэмж дурдахад паркет формат нь өгөгдлийг хэрхэн хадгалах вэ?

ӨГӨГДӨЛ BLOCK -д байгаа блок бүр паркет файл байна хадгалсан эгнээний бүлгүүдийн хэлбэрээр. Тэгэхээр, өгөгдөл дотор паркет файлыг олон эгнээний бүлэгт хуваасан. Эдгээр эгнээний бүлгүүд нь нэг буюу хэд хэдэн баганын хэсгүүдээс бүрдэх бөгөөд энэ нь баганад харгалзах болно өгөгдөл тогтоосон. The өгөгдөл хуудас хэлбэрээр бичсэн баганын хэсэг бүрийн хувьд.

Паркетан нь хүн унших боломжтой юу?

ORC, Паркет , болон Avro нь бас машин- унших боломжтой хоёртын форматтай, өөрөөр хэлбэл файлууд нь утгагүй харагдаж байна хүмүүс . Хэрэв чамд хэрэгтэй бол хүн - унших боломжтой JSON эсвэл XML гэх мэт форматтай бол та юуны түрүүнд Hadoop-г яагаад ашиглаж байгаагаа дахин бодож үзэх хэрэгтэй.

Зөвлөмж болгож буй: