Spark Python-ийн ямар хувилбарыг ашигладаг вэ?
Spark Python-ийн ямар хувилбарыг ашигладаг вэ?

Видео: Spark Python-ийн ямар хувилбарыг ашигладаг вэ?

Видео: Spark Python-ийн ямар хувилбарыг ашигладаг вэ?
Видео: Apache Spark гэж юу вэ? 2024, Арванхоёрдугаар сар
Anonim

Оч Java 8+ дээр ажилладаг, Python 2.7+/3.4+ ба R 3.1+. Scala API-ийн хувьд, Оч 2.3. 0 ашигладаг Скала 2.11. Та хэрэгтэй болно ашиглах нийцтэй Scala хувилбар (2.11.

Үүний дагуу оч нь Python 3 дээр ажилладаг уу?

Апачи Оч нь кластер тооцооллын систем бөгөөд одоогоор нээлттэй эхийн Big Data талбарт хамгийн идэвхтэй хөгжиж буй нэг юм. Хамгийн сүүлийн үеийн 1.4 хувилбараас хойш (2015 оны 6-р сар), Оч R болон дэмждэг Python 3 (Өмнө нь Java, Scala болон Python 2).

Дээрээс нь би Python-ийн spark хувилбарыг хэрхэн өөрчлөх вэ? Хэрэв та зөвхөн хүсэж байгаа бол өөрчлөх нь питон хувилбар Одоогийн даалгаврын хувьд та дараах pyspark эхлүүлэх командыг ашиглаж болно: PYSPARK_DRIVER_PYTHON=/home/user1/anaconda2/bin/ питон PYSPARK_PYTHON=/usr/local/anaconda2/bin/ питон pyspark - мастер..

Цаашилбал, хамгийн сүүлийн үеийн spark хувилбар юу вэ?

Апачи оч

Жинхэнэ зохиогч(ууд) Матей Захариа
Анхны хувилбар 2014 оны тавдугаар сарын 26
Тогтвортой хувилбар 2.4.5 / 2020 оны 2-р сарын 8
Хадгалах газар Spark Repository
Бичсэн Скала

Spark Python гэж юу вэ?

Apache ашиглан том өгөгдлийг зөөлрүүлэх Оч болон Python Py4J бол дотроо нэгдсэн алдартай номын сан юм PySpark тэгнэ питон JVM объектуудтай динамик интерфэйс (RDD). Апачи Оч нь интерактив бүрхүүлийн хамт ирдэг питон Энэ нь Скалагийн адил. Бүрхүүл нь питон гэж нэрлэдэг PySpark ”.

Зөвлөмж болгож буй: