Видео: Та ETL өгөгдлийг хэрхэн ашигладаг вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Уламжлалт ETL үйл явц
нь ETL үйл явц: олборлох, хувиргах, ачаалах. Дараа нь дүн шинжилгээ хий. Танай бизнес эрхэлдэг эх сурвалжаас иш татна уу. Өгөгдөл нь онлайн гүйлгээ боловсруулах (OLTP) мэдээллийн сангаас гаргаж авсан бөгөөд өнөөдөр "гүйлгээний мэдээллийн сан" болон бусад өгөгдөл эх сурвалжууд.
Мөн асуулт бол ETL гэж юу вэ, энэ нь хэрхэн ажилладаг вэ?
ETL нь задлах, хувиргах, ачаалах, нэг өгөгдлийн сангаас өгөгдлийг гаргаж авах, өөр мэдээллийн санд байрлуулах нэг хэрэгсэлд нэгтгэгдсэн гурван мэдээллийн сангийн функцийн товчлол юм. Extract гэдэг нь мэдээллийн сангаас өгөгдлийг унших үйл явц юм. Дүрэм эсвэл хайлтын хүснэгтийг ашиглах эсвэл өгөгдлийг бусад өгөгдөлтэй нэгтгэх замаар хувиргах үйл явц явагдана.
Мэдээллийн агуулах дахь ETL гэж юу вэ? ETL доторх үйл явц юм Өгөгдлийн агуулах мөн энэ нь Extract, Transform and Load гэсэн үгийн товчлол юм. Энэ нь үйл явц юм ETL хэрэгсэл гаргаж авдаг өгөгдөл янз бүрийн зүйлээс өгөгдөл эх системүүд, түүнийг үе шаттайгаар хувиргаж, дараа нь эцэст нь үүнийг ачаална Өгөгдлийн агуулах систем.
Үүний нэгэн адил, ETL процессын жишээ юу вэ?
ETL Мэдээллийн агуулах: Хамгийн түгээмэл жишээ -ийн ETL байна ETL Мэдээллийн агуулахад ашигладаг. Түүний мэдээллийн эх сурвалж өөр байж болно. Хэрэглэгч олон янзын системээс өгөгдлийг татаж аваад нэг зорилтот системд ачаалах шаардлагатай бөгөөд үүнийг мэдээллийн агуулах гэж нэрлэдэг.
ETL системийн өөр өөр мэдээллийн эх сурвалж юу вэ?
Ихэнх ETL системүүд нэгтгэх өгөгдөл -аас олон эх сурвалж системүүд , тус бүр өөрийн гэсэн онцлогтой өгөгдөл Зохион байгуулалт ба формат - үүнд хамаарлын өгөгдлийн сан, хамааралгүй мэдээллийн сан, XML, JSON, CSV файлууд гэх мэт. Амжилттай задлах хөрвүүлэлтүүд өгөгдөл стандартчилсан боловсруулалтын нэг хэлбэрт.
Зөвлөмж болгож буй:
Өгөгдлийн санд оруулахдаа өгөгдлийг хэрхэн баталгаажуулах вэ?
Баталгаажуулалт гэдэг нь мэдээллийн санд оруулсан өгөгдлийг бодитой эсэхийг шалгах үйл явц юм. Энэ нь оруулсан өгөгдөл зөв эсэхийг шалгах боломжгүй. Энэ нь зөвхөн өгөгдөл нь утга учиртай эсэхийг шалгах боломжтой. Баталгаажуулалт нь өгөгдөл оруулах явцад гарах алдааны тоог багасгах арга юм
Эмнэлгийн болон удирдлагын янз бүрийн мэдээллийн системүүдийн хооронд эмнэлзүйн болон захиргааны өгөгдлийг дамжуулахад ямар стандартыг ашигладаг вэ?
Эрүүл мэндийн долоон түвшин буюу HL7 гэдэг нь янз бүрийн эрүүл мэндийн үйлчилгээ үзүүлэгчдийн ашигладаг программ хангамжийн хооронд эмнэлзүйн болон захиргааны мэдээллийг дамжуулах олон улсын стандартыг хэлнэ. Эдгээр стандартууд нь OSI загварт "давхарга 7" болох хэрэглээний давхаргад төвлөрдөг
Эрүүл мэндийн салбарт том өгөгдлийг хэрхэн ашигладаг вэ?
Эрүүл мэндийн салбарт том өгөгдөл нь хүн ам эсвэл хувь хүний тодорхой статистик мэдээллийг ашиглан шинэ дэвшлийг судлах, зардлыг бууруулах, тэр байтугай өвчний эхэн үеийг эмчлэх, урьдчилан сэргийлэхэд ашигладаг. Үйлчилгээ үзүүлэгчид өөрсдийн туршлага, туршлагаасаа илүү том мэдээллийн судалгаанд үндэслэн шийдвэр гаргаж байна
Sqoop нь өгөгдлийг импортлох, экспортлоход юу ашигладаг вэ?
Sqoop бол Hadoop болон харилцааны мэдээллийн сангуудын хооронд өгөгдөл дамжуулахад зориулагдсан хэрэгсэл юм. Sqoop нь энэ процессын ихэнхийг автоматжуулж, мэдээллийн бааз дээр тулгуурлан импортлох өгөгдлийн схемийг тодорхойлдог. Sqoop нь MapReduce-г ашиглан өгөгдлийг импортлох, экспортлох бөгөөд энэ нь зэрэгцээ ажиллагаа, алдааг тэсвэрлэх боломжийг олгодог
Оптик диск дээрх өгөгдлийг уншихад ашигладаг уу?
Оптик дискний гадаргуу дээрх бит мэдээллийг унших, бичихийн тулд лазер туяаг ашигладаг дискний хөтөч. CD нь 700 МБ өгөгдөл, үндсэн DVD нь 4.7 ГБ өгөгдөл багтаах боломжтой бол нэг Blu-ray диск нь 25 ГБ хүртэл өгөгдөл хадгалах боломжтой