Аль төрлийн кластер нь том өгөгдлийг зохицуулах боломжтой вэ?
Аль төрлийн кластер нь том өгөгдлийг зохицуулах боломжтой вэ?

Видео: Аль төрлийн кластер нь том өгөгдлийг зохицуулах боломжтой вэ?

Видео: Аль төрлийн кластер нь том өгөгдлийг зохицуулах боломжтой вэ?
Видео: Leslie Kean on David Grusch (UFO Whistleblower): Non-Human Intelligence, Recovered UFOs, UAP, & more 2024, Арванхоёрдугаар сар
Anonim

Шаталсан бөөгнөрөл чадахгүй том өгөгдөлтэй ажиллах сайн гэхдээ K гэсэн үг бөөгнөрөл чадна. Учир нь K дундаж утгын цагийн нарийн төвөгтэй байдал нь шугаман, өөрөөр хэлбэл O(n) байхад шаталсан байна. бөөгнөрөл квадрат, өөрөөр хэлбэл O(n2).

Үүнтэй холбогдуулан том өгөгдөлд кластер гэж юу вэ?

Кластер хийх нь бүлэглэхийг багтаасан Машин сургалтын техник юм өгөгдөл оноо. багц өгсөн өгөгдөл оноо, бид ашиглаж болно бөөгнөрөл тус бүрийг ангилах алгоритм өгөгдөл тодорхой бүлэгт зааж өгөх.

Үүнтэй адилаар кластер, түүний төрлүүд гэж юу вэ? Кластер хийх маркетинг, био-анагаах ухаан, гео-орон зайн гэх мэт салбаруудаас цуглуулсан олон талт өгөгдлийн багц дахь ижил төстэй объектуудын бүлгийг тодорхойлоход ашигладаг аргууд. Тэд өөр төрөл -ийн бөөгнөрөл аргууд, үүнд: Хуваалтын аргууд. Шаталсан бөөгнөрөл . Загвар дээр суурилсан бөөгнөрөл.

Маш том өгөгдлийн багцад аль төрлийн кластерийн алгоритм илүү дээр болохыг мэдэхийн тулд?

K- гэсэн үг Энэ нь хамгийн их хэрэглэгддэг зүйлсийн нэг юм бөөгнөрөл аргууд ба K- гэсэн үг MapReduce дээр суурилсан нь дэвшилтэт шийдэл гэж тооцогддог маш том өгөгдлийн багц кластер . Гэсэн хэдий ч давталтын тоо нэмэгдэж байгаа тул гүйцэтгэх хугацаа нь саад тотгор хэвээр байна. өгөгдлийн багц хэмжээ, тоо кластерууд.

Кластеринг юунд ашиглагддаг вэ?

Кластер хийх нь хараа хяналтгүй суралцах арга бөгөөд статистик мэдээлэлд дүн шинжилгээ хийх нийтлэг арга юм - д ашигласан олон талбар. Мэдээллийн шинжлэх ухаанд бид ашиглаж болно бөөгнөрөл дүн шинжилгээ хийх замаар бид өгөгдлийг ашиглах үед өгөгдлийн цэгүүд ямар бүлэгт багтаж байгааг харах замаар бидний өгөгдлөөс үнэ цэнэтэй ойлголтыг олж авах болно. бөөгнөрөл алгоритм.

Зөвлөмж болгож буй: