Spark дотоод файлуудыг уншиж чадах уу?
Spark дотоод файлуудыг уншиж чадах уу?

Видео: Spark дотоод файлуудыг уншиж чадах уу?

Видео: Spark дотоод файлуудыг уншиж чадах уу?
Видео: Вспомнить всё ► 3 Прохождение The Medium 2024, Арваннэгдүгээр
Anonim

байхад Оч ачааллыг дэмждэг файлууд аас орон нутгийн файлын систем нь үүнийг шаарддаг файлууд нь таны кластерын бүх зангилаанууд дээр нэг зам дээр байдаг. NFS, AFS, MapR-ийн NFS давхарга гэх мэт зарим сүлжээний файлын системүүд нь энгийн файлын систем шиг хэрэглэгчдэд илэрдэг.

Дараа нь би локал горимд spark-ийг хэрхэн ажиллуулах вэ гэж асууж магадгүй юм.

онд орон нутгийн горим , оч ажлын байр гүйх нэг машин дээр, олон урсгалыг ашиглан зэрэгцээ гүйцэтгэгддэг: энэ нь параллелизмыг (хамгийн ихдээ) таны машин дахь цөмийн тоогоор хязгаарладаг. руу гүйх дахь ажил орон нутгийн горим , та эхлээд интерактив горимд SLURM-ээр дамжуулан машин захиалах хэрэгтэй горим түүн рүү нэвтэрч орно уу.

Дээрхээс гадна SC textFile гэж юу вэ? textFile байгууллагын арга юм. apache. SparkContext уншдаг анги а текст файл HDFS, локал файлын систем (бүх зангилаанууд дээр байдаг) эсвэл Hadoop дэмждэг аливаа файлын системийн URI-аас авах ба үүнийг Strings RDD болгон буцаана.

Үүнтэй холбогдуулан spark файл гэж юу вэ?

The Spark файл нь таны бүх бүтээлч сайн сайхныг хадгалдаг баримт бичиг юм. Үүнийг зохиолч Стивен Жонсон тодорхойлсон. Тиймээс та шөнө дунд Post-it® дээр тэмдэглэл маажих эсвэл өөр өөр сэтгүүлүүдийг санаа бодолд зориулахын оронд бүх ойлголтоо нэг дор цуглуулдаг. файл.

Зэрэгцээ цуглуулгын оч гэж юу вэ?

Бид тараагдсан өгөгдлийн багц дээрх үйлдлүүдийг дараа нь тайлбарлах болно. Зэрэгцээ цуглуулгууд JavaSparkContext-ийг дуудаж үүсгэнэ зэрэгцүүлэх одоо байгаа арга Цуглуулга таны драйвер програм дээр. -ийн элементүүд цуглуулга зэрэгцээ ажиллах боломжтой тархсан өгөгдлийн багц үүсгэхийн тулд хуулж авдаг.

Зөвлөмж болгож буй: