Агуулгын хүснэгт:

Би хэрхэн sqoop гүйцэтгэлээ сайжруулах вэ?
Би хэрхэн sqoop гүйцэтгэлээ сайжруулах вэ?

Видео: Би хэрхэн sqoop гүйцэтгэлээ сайжруулах вэ?

Видео: Би хэрхэн sqoop гүйцэтгэлээ сайжруулах вэ?
Видео: Ажлын гүйцэтгэлийг хэрхэн сайжруулах вэ? 2024, Арваннэгдүгээр
Anonim

Оновчлохын тулд гүйцэтгэл , тогтоосон нь -аас бага утгатай газрын зургийн ажлын тоо нь холболтын хамгийн их тоо нь мэдээллийн санг дэмждэг. Хянаж байна нь параллелизмын хэмжээ Скооп өгөгдөл дамжуулахад ашиглах болно нь хянах гол арга зам нь ачаалах чиний мэдээллийн сан.

Үүний дагуу процессын хооронд sqoop амжилтгүй болвол яах вэ?

Ердийн Скооп Эх сурвалжийн өгөгдлийн сангаас HDFS руу өгөгдөл оруулж байгаа ажил нь өгөгдлийг зорилтот лавлах руу хуулах болно. Хуулсан файлыг устгах гэж байна хэрэв sqoop амжилтгүй бол дуусгахгүйгээр.

Та sqoop-д параллелизмд хэрхэн хүрэх вэ? Хянаж байна Параллелизм . Скооп ихэнх өгөгдлийн сангийн эх сурвалжаас өгөгдлийг зэрэгцүүлэн импортолдог. Та -m эсвэл --num-mappers аргументыг ашиглан импортыг гүйцэтгэх газрын зургийн ажлын тоог (зэрэгцээ процесс) зааж өгч болно. Эдгээр аргумент бүр нь зэрэгтэй тохирох бүхэл тоон утгыг авдаг параллелизм ажилд авах

Тиймээс би Hive асуулгын гүйцэтгэлээ хэрхэн сайжруулах вэ?

Hive Queries-ийг оновчтой болгохын тулд бидний дагаж мөрдөх практикуудын жагсаалтыг доор харуулав

  1. Hive дахь шахалтыг идэвхжүүлнэ үү.
  2. Нэгдмэлүүдийг оновчтой болгох.
  3. Hive-д глобал эрэмбэлэхээс зайлсхий.
  4. Tez гүйцэтгэх системийг идэвхжүүлнэ үү.
  5. LIMIT операторыг оновчтой болгох.
  6. Зэрэгцээ гүйцэтгэлийг идэвхжүүлэх.
  7. Mapreduce хатуу горимыг идэвхжүүлнэ үү.
  8. Multi Group BY-д зориулсан нэг удаагийн бууралт.

Sqoop split хэрхэн ажилладаг вэ?

Үүнийг илүү их параллелизмд хүрэх замаар импортын гүйцэтгэлийг сайжруулахад ашиглаж болно. Скооп бий болгодог хуваагдана --аар тодорхойлсон хүснэгтийн тодорхой баганын утгууд дээр үндэслэсэн. салгах -хэрэглэгч импортын командаар дамжуулан. Хэрэв энэ боломжгүй бол оролтын хүснэгтийн үндсэн түлхүүрийг үүсгэхэд ашиглана хуваагдана.

Зөвлөмж болгож буй: