Видео: Өгөгдөл олборлолтод ойр байх нь юу вэ?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:51
Ойролцоох хэмжүүрүүд нь ижил төстэй ба ялгаатай байдлын хэмжүүрүүдэд хамаарна. Ижил төстэй байдал, ялгаатай байдал нь чухал ач холбогдолтой, учир нь тэдгээрийг хэд хэдэн хүн ашигладаг өгөгдөл олборлолт бөөгнөрөл, хамгийн ойрын хөршийн ангилал, гажиг илрүүлэх зэрэг аргууд.
Үүнтэй холбогдуулан ойрын хэмжүүр гэж юу вэ?
Ойролцоох арга хэмжээ эмпирик судалгааны үндэс болсон объект, зүйл, өдөөгч, хүмүүсийн хооронд байгаа ижил төстэй эсвэл ялгаатай байдлыг тодорхойлох.
Дээрхээс гадна матрицын ойролцоо байдлыг хэрхэн олох вэ? Зайны матриц
- Объект хоорондын ойртлыг зайны матрицаар хэмжиж болно.
- Жишээлбэл, А = (1, 1) ба B = (1.5, 1.5) объектын хоорондох зайг тооцоолно.
- D = (3, 4) ба F = (3, 3.5) объектын хоорондох зайны өөр нэг жишээг дараах байдлаар тооцоолно.
Тэгвэл дата олборлолтын ижил төстэй, ялгаатай байдал гэж юу вэ?
Ижил төстэй байдал ба ялгаатай байдал дараагийнх нь өгөгдөл олборлолт үзэл баримтлалыг бид хэлэлцэх болно. Ижил төстэй байдал гэдэг нь хоёр хоорондоо хэр адилхан болохыг харуулсан тоон хэмжүүр юм өгөгдөл объектууд нь, ба ялгаатай байдал гэдэг нь хоёр хоорондоо хэр ялгаатай болохыг харуулсан тоон хэмжүүр юм өгөгдөл объектууд юм.
Үл ялгаатай матриц гэж юу вэ?
The Үл ялгаатай байдлын матриц нь матриц Энэ нь хоёр багцын хоорондох ижил төстэй хосыг илэрхийлдэг. Энэ нь дөрвөлжин, тэгш хэмтэй. Диагональ гишүүдийг тэг гэж тодорхойлсон бөгөөд тэг нь хэмжигдэхүүн юм ялгаатай байдал элемент ба өөрөө хооронд.
Зөвлөмж болгож буй:
Өгөгдөл олборлолтод кластер хийхэд ямар шаардлага тавигддаг вэ?
Кластер хийх алгоритмын хангах ёстой гол шаардлага нь: өргөтгөх чадвар; янз бүрийн шинж чанаруудтай харьцах; дурын хэлбэртэй кластеруудыг илрүүлэх; оролтын параметрүүдийг тодорхойлох домэйны мэдлэгт тавигдах хамгийн бага шаардлага; чимээ шуугиан, хэт их хүчин зүйлийг даван туулах чадвар;
Өгөгдөл олборлолтод кластер шинжилгээ гэж юу вэ?
Кластер гэдэг нь хийсвэр объектуудын бүлгийг ижил төстэй объектуудын ангилалд оруулах үйл явц юм. Санах ёстой оноо. Өгөгдлийн объектуудын кластерыг нэг бүлэг гэж үзэж болно. Кластерийн шинжилгээ хийхдээ бид эхлээд өгөгдлийн ижил төстэй байдалд үндэслэн багц өгөгдлийг бүлэгт хувааж, дараа нь бүлгүүдэд шошгыг оноодог
Өгөгдөл олборлолтод ангилах ямар арга техник байдаг вэ?
Өгөгдөл олборлолт нь нийтлэг зургаан төрлийн даалгаврыг агуулдаг. Аномали илрүүлэх, Холбооны дүрэмд суралцах, Кластер хийх, Ангилал, Регресс, Дүгнэлт. Ангилал нь өгөгдөл олборлох гол арга бөгөөд янз бүрийн салбарт өргөн хэрэглэгддэг
Өгөгдөл олборлолтод ямар төрлийн өгөгдөл байдаг вэ?
Ямар төрлийн өгөгдөл олборлож болохыг ярилцъя: Хавтгай файлууд. Харилцааны мэдээллийн сан. Өгөгдлийн агуулах. Гүйлгээний мэдээллийн сан. Мультимедиа мэдээллийн сан. Орон зайн мэдээллийн сан. Цагийн цуврал мэдээллийн сан. World Wide Web(WWW)
Кластер гэдэг нь түүний өгөгдөл олборлолтод гүйцэтгэх үүргийг юу гэж тайлбарладаг вэ?
Танилцуулга. Энэ нь өгөгдлийн элементүүдийг холбогдох бүлгүүдэд байрлуулахад ашигладаг өгөгдөл олборлох арга юм. Кластер гэдэг нь өгөгдлийг (эсвэл объектуудыг) нэг ангид хуваах үйл явц бөгөөд нэг ангид байгаа өгөгдөл нь бусад кластерынхаас илүү төстэй байдаг