Видео: Том өгөгдөлд Импала гэж юу вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Импала нь Apache Hadoop гэх мэт кластер системүүдийн дээр байрладаг нээлттэй эхийн асар их хэмжээний зэрэгцээ боловсруулалтын асуулгын систем юм. Үүнийг Google-ийн Dremel цаасан дээр үндэслэн бүтээсэн. Энэ нь Hadoop Distributed File System (HDFS) дээр ажилладаг асуулгын системтэй адил интерактив SQL юм. Импала HDFS-ийг үндсэн хадгалалт болгон ашигладаг.
Үүнтэй холбогдуулан Импала ба үүр гэж юу вэ?
Апачи Зөгий нь SQL-in-Hadoop-ын үр дүнтэй стандарт юм. Импала нь Google Dremel-ийн дараа боловсруулсан нээлттэй эхийн SQL хайлтын систем юм. Cloudera Импала нь HBase болон HDFS-д хадгалагдсан өгөгдлийг боловсруулахад зориулагдсан SQL хөдөлгүүр юм. Импала ашигладаг Зөгий megastore болон асууж болно Зөгий хүснэгтүүд шууд.
Цаашилбал, үүр эсвэл Импала аль нь дээр вэ? Апачи Зөгий интерактив тооцоололд тохиромжгүй байж болох юм Импала интерактив тооцоололд зориулагдсан. Зөгий багц дээр суурилсан Hadoop MapReduce харин Импала байна илүү МАН-ын мэдээллийн сан шиг. Зөгий нарийн төвөгтэй төрлүүдийг дэмждэг боловч Импала үгүй. Апачи Зөгий алдааг тэсвэрлэдэг, харин Импала алдааг тэсвэрлэх чадварыг дэмждэггүй.
Мөн бид яагаад Импала хэрэглэдэг вэ?
Импала санах ойн өгөгдөл боловсруулалтыг дэмждэг, өөрөөр хэлбэл, өгөгдөлд ханддаг/шинжилдэг байна өгөгдлийн хөдөлгөөнгүйгээр Hadoop өгөгдлийн зангилаанууд дээр хадгалагдана. Чи чадна өгөгдөлд хандах Impala ашиглан SQL-тэй төстэй асуулга. Импала бусад SQL хөдөлгүүртэй харьцуулахад HDFS дахь өгөгдөлд илүү хурдан нэвтрэх боломжийг олгодог.
Big data дахь үүр гэж юу вэ?
Апачи Зөгий нь өгөгдөл агуулахын систем өгөгдөл хураангуй, дүн шинжилгээ хийх, том хэмжээний асуулга хийх өгөгдөл нээлттэй эхийн Hadoop платформ дахь системүүд. Энэ нь SQL-тэй төстэй асуултуудыг MapReduce ажил болгон хувиргаж, маш их хэмжээний файлуудыг хялбархан гүйцэтгэх, боловсруулахад тусалдаг. өгөгдөл.
Зөвлөмж болгож буй:
Том өгөгдөлд өгөгдөл шингээх гэж юу вэ?
Мэдээлэл залгих гэдэг нь өгөгдлийн санд шууд ашиглах, хадгалах зорилгоор өгөгдлийг олж авах, импортлох үйл явц юм. Ямар нэг зүйлийг залгина гэдэг нь "ямар нэг зүйлийг авах, шингээх" гэсэн үг юм. Мэдээллийг бодит цаг хугацаанд дамжуулах эсвэл багцаар оруулах боломжтой
Java том өгөгдөлд чухал уу?
Хүчтэй бичдэг. Java нь төрлийн аюулгүй байдлын талаар маш их санаа тавьдаг. Энэ функц нь Big Data програмуудыг хөгжүүлэх, Java хэл дээрх өгөгдлийн шинжлэх ухааныг боловсруулахад чухал ач холбогдолтой юм. Java бол өндөр бүтээмжтэй (ETL) код бичихэд ашигладаг өндөр үр дүнтэй эмхэтгэсэн хэл бөгөөд машин сургалтын алгоритмууд юм
Хамгийн том том дэлгэцтэй зурагт юу вэ?
Samsung-ийн 110 инчийн Ultra HD ТВ нь дэлхийн хамгийн том зурагт бөгөөд даваа гарагт худалдаанд гарна
Том өгөгдөлд ашиглах тохиолдол гэж юу вэ?
Хэдийгээр том өгөгдөл ашиглах тохиолдлын дийлэнх нь өгөгдөл хадгалах, боловсруулахтай холбоотой байдаг ч үйлчлүүлэгчийн дүн шинжилгээ, эрсдэлийн үнэлгээ, залилан илрүүлэх зэрэг бизнесийн олон талыг хамардаг. Тиймээс бизнес бүр өөрийн хэрэгцээг хангахын тулд холбогдох хэрэглээний тохиолдлыг олох боломжтой
R-ийн аналитик нь том өгөгдөлд хэр тохиромжтой вэ?
R нь олон тооны өгөгдлийн багц, тавиурын график функц гэх мэтийг агуулдаг бөгөөд энэ нь өгөгдөл боловсруулах үр дүнтэй чадвартай тул том өгөгдлийн аналитикийн чадварлаг хэл болохыг баталж байна. Майкрософт, Google зэрэг технологийн аварга том өгөгдлийн шинжилгээнд R ашиглаж байна