Видео: Та стандарт хазайлтад хэт давсан үзүүлэлтүүдийг оруулсан уу?
2024 Зохиолч: Lynn Donovan | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2023-12-15 23:50
Стандарт хэлбэлзэл хэзээ ч сөрөг байдаггүй. Стандарт хэлбэлзэл мэдрэмтгий байдаг хэт давсан үзүүлэлтүүд . Ганц бие хэт давчуу өсгөж чадна стандарт хэлбэлзэл мөн эргээд тархалтын зургийг гажуудуулна. Ойролцоогоор ижил утгатай өгөгдлийн хувьд тархалт их байх тусам их байна стандарт хэлбэлзэл.
Үүнтэй холбогдуулан стандарт хазайлт нь хэт их утгыг ашигладаг уу?
Хэрэв утга нь тодорхой тоо юм стандарт хазайлт Дунджаас хол байх үед тухайн өгөгдлийн цэг нь тодорхойлогддог хэт давчуу . Энэ арга нь илрүүлж чадахгүй байж болно хэт давсан үзүүлэлтүүд учир нь хэт давсан үзүүлэлтүүд нэмэгдүүлэх стандарт хэлбэлзэл . Илүү эрс тэс байх тусмаа хэт давчуу , илүү их стандарт хэлбэлзэл нөлөөлж байна.
Үүнтэй адилаар, юуг хэтрүүлсэн гэж тооцох вэ? Хэт их . Жишээлбэл, дээрх зургийн хамгийн зүүн талд байгаа цэг нь a хэт давчуу . -ийн тохиромжтой тодорхойлолт хэт давчуу Гуравдугаар квартильаас дээш буюу нэгдүгээр квартилаас доош 1.5 дахин их унадаг цэг юм. Хэт өндөр үзүүлэлтүүд Хоёр багц өгөгдлийн хоорондын хамаарлыг харьцуулах үед ч тохиолдож болно.
Үүний дагуу хэд нь стандарт хазайлтаас давсан үзүүлэлт вэ?
3-аас гадуурх утга стандарт хазайлт тархалтын нэг хэсэг боловч 370 сорьцын 1-д тохиолдох магадлал багатай ховор үзэгдэл юм. Гурав стандарт хазайлт дундаас нь тодорхойлох практикт нийтлэг таслагдах юм хэт давсан үзүүлэлтүүд Гаусс эсвэл Гаусстай төстэй хуваарилалтаар.
1.5 IQR дүрэм гэж юу вэ?
Квартиль хоорондын Дүрэм For Outliers Бидний хийх ёстой зүйл бол дараах зүйл юм: Квартиль хоорондын мужийг үржүүлэх ( IQR ) тоогоор 1.5 . Нэмэх 1.5 x ( IQR ) гурав дахь дөрөвний нэг хүртэл. Үүнээс их тоо бол сэжигтэй хэтийн тоо юм. Хасах 1.5 x( IQR ) эхний дөрөвний нэгээс.
Зөвлөмж болгож буй:
SQL серверт хамгийн сүүлд оруулсан бичлэгийг яаж авах вэ?
SQL Server SELECT @@IDENTITY-д хамгийн сүүлд оруулсан бичлэгийг тодорхойлох. Энэ нь утгыг үүсгэсэн хүснэгт болон утгыг үүсгэсэн мэдэгдлийн хамрах хүрээнээс үл хамааран холболт дээр үүсгэсэн сүүлчийн IDENTITY утгыг буцаана. SCOPE_IDENTITY() СОНГОХ IDENT_CURRENT('ХүснэгтНэр')
Оруулсан ширээ гэж юу вэ?
Суурилуулсан ширээ нь нөгөө хүснэгтийн дотор байрлуулсан нэг ширээ бөгөөд том ширээ нь жижиг ширээг хадгалах савны үүрэг гүйцэтгэдэг. Суурилуулсан хүснэгтүүд нь зураг, текст зэрэг объектуудыг тэгш зайтай мөр, баганад цэгцлэх арга юм
Өгөгдлийн шинжилгээнд хэт давсан үзүүлэлтүүд юу вэ?
Статистикийн хувьд хэт давсан үзүүлэлт нь бусад ажиглалтаас эрс ялгаатай мэдээллийн цэг юм. Анутлиер нь хэмжилтийн хэлбэлзэлтэй холбоотой эсвэл туршилтын алдааг илэрхийлж болно; Сүүлийнх нь заримдаа өгөгдлийн багцаас хасагддаг. Хэт өндөр үзүүлэлт нь статистикийн шинжилгээнд ноцтой асуудал үүсгэж болзошгүй
Та 5 тооны хураангуйд хэт давсан үзүүлэлтүүдийг оруулдаг уу?
Таван тоо нь хамгийн бага, эхний дөрөвний (Q1) утга, медиан, гурав дахь дөрөвний (Q3) утга, дээд хэмжээ юм. Энэ өгөгдлийн багцын талаар таны анзаарч болох хамгийн эхний зүйл бол 27 дугаар юм. Энэ нь бусад өгөгдлөөс тэс өөр юм. Энэ нь хэт давсан үзүүлэлт бөгөөд үүнийг арилгах ёстой
Өгөгдөл дэх хэт давсан үзүүлэлт юунд хүргэдэг вэ?
Өгөгдөл цуглуулах, бүртгэх, оруулах явцад гарсан алдаа гэх мэт хүний алдаанаас болж хэт давсан үзүүлэлтүүд ихэвчлэн гардаг. Ярилцлагын өгөгдлийг буруу бүртгэх эсвэл өгөгдөл оруулах үед буруу бичих боломжтой