Агуулгын хүснэгт:
Видео: Өгөгдөл олборлолтод ангилах ямар арга техник байдаг вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Өгөгдлийн олборлолт Нийт зургаан төрлийн даалгаврыг багтаасан. Аномали илрүүлэх, Холбооны дүрэмд суралцах, Кластер хийх, Ангилал , Регресс, Дүгнэлт. Ангилал хошууч цолтой өгөгдөл олборлох техник янз бүрийн салбарт өргөн хэрэглэгддэг.
Үүнийг харгалзан үзэхэд ангилах арга нь юу вэ?
Ангиллын алгоритмын төрлүүд
- Шугаман ангилагч. Логистик регресс. Naive Bayes ангилагч. Фишерийн шугаман дискриминант.
- Вектор машинуудыг дэмжих. Хамгийн бага квадратууд вектор машинуудыг дэмждэг.
- Квадрат ангилагч.
- Цөмийн тооцоо. k-хамгийн ойрын хөрш.
- Шийдвэрийн мод. Санамсаргүй ой.
- Мэдрэлийн сүлжээ.
- Векторын квантчлалд суралцах.
Хоёрдугаарт, өгөгдөл олборлолтод ангиллын дүрэм гэж юу вэ? дээр хийсэн судалгаа ангилал техникүүд өгөгдөл олборлолт . Энгийн тодорхойлолтоор, in ангилал /clustering -ийн багцад дүн шинжилгээ хийх өгөгдөл мөн бүлэглэлийн багц үүсгэх дүрэм ашиглаж болох юм ангилах ирээдүй өгөгдөл.
Үүнтэй адилаар хэн нэг нь дата олборлолтод ангилахад ямар техник ашигладаг вэ?
Регресс ба Ангилал илүү алдартай хоёр юм Ангилах арга . Ангилал хуваах дүрмийг олохыг хамарна өгөгдөл салангид бүлгүүдэд хуваагдана. -д зориулсан оролт ангилал сургалт юм өгөгдөл ангийн шошго нь аль хэдийн мэдэгдэж байгаа багц.
Өгөгдөл олборлолтод Bayesian ангилал гэж юу вэ?
Өгөгдлийн олборлолт - Байесын ангилал . Зар сурталчилгаа. Байесийн ангилал дээр тулгуурладаг Бэйс Теорем. Bayesian ангилагч нь статистикийн ангилагч юм. Bayesian Ангилагч нь тухайн ангиллын тодорхой ангилалд хамаарах магадлал гэх мэт ангийн гишүүнчлэлийн магадлалыг урьдчилан таамаглаж чадна.
Зөвлөмж болгож буй:
Бүлгийн өгөгдөл болон бүлэггүй өгөгдөл хоёрын хооронд ямар ялгаа байдаг вэ?
Аль аль нь өгөгдлийн ашигтай хэлбэр боловч тэдгээрийн ялгаа нь бүлэггүй өгөгдөл нь түүхий өгөгдөл юм. Энэ нь дөнгөж цуглуулсан боловч ямар ч бүлэг, ангид ангилаагүй гэсэн үг юм. Нөгөөтэйгүүр, бүлэглэсэн өгөгдөл нь түүхий өгөгдлөөс бүлэг болгон зохион байгуулагдсан өгөгдөл юм
Өгөгдөл олборлолтод кластер хийхэд ямар шаардлага тавигддаг вэ?
Кластер хийх алгоритмын хангах ёстой гол шаардлага нь: өргөтгөх чадвар; янз бүрийн шинж чанаруудтай харьцах; дурын хэлбэртэй кластеруудыг илрүүлэх; оролтын параметрүүдийг тодорхойлох домэйны мэдлэгт тавигдах хамгийн бага шаардлага; чимээ шуугиан, хэт их хүчин зүйлийг даван туулах чадвар;
Өгөгдөл олборлолтод кластер шинжилгээ гэж юу вэ?
Кластер гэдэг нь хийсвэр объектуудын бүлгийг ижил төстэй объектуудын ангилалд оруулах үйл явц юм. Санах ёстой оноо. Өгөгдлийн объектуудын кластерыг нэг бүлэг гэж үзэж болно. Кластерийн шинжилгээ хийхдээ бид эхлээд өгөгдлийн ижил төстэй байдалд үндэслэн багц өгөгдлийг бүлэгт хувааж, дараа нь бүлгүүдэд шошгыг оноодог
Өгөгдөл олборлолтод ямар төрлийн өгөгдөл байдаг вэ?
Ямар төрлийн өгөгдөл олборлож болохыг ярилцъя: Хавтгай файлууд. Харилцааны мэдээллийн сан. Өгөгдлийн агуулах. Гүйлгээний мэдээллийн сан. Мультимедиа мэдээллийн сан. Орон зайн мэдээллийн сан. Цагийн цуврал мэдээллийн сан. World Wide Web(WWW)
Кластер гэдэг нь түүний өгөгдөл олборлолтод гүйцэтгэх үүргийг юу гэж тайлбарладаг вэ?
Танилцуулга. Энэ нь өгөгдлийн элементүүдийг холбогдох бүлгүүдэд байрлуулахад ашигладаг өгөгдөл олборлох арга юм. Кластер гэдэг нь өгөгдлийг (эсвэл объектуудыг) нэг ангид хуваах үйл явц бөгөөд нэг ангид байгаа өгөгдөл нь бусад кластерынхаас илүү төстэй байдаг