Агуулгын хүснэгт:

Та Дирихлетийн далд хуваарилалтыг хэрхэн ашигладаг вэ?
Та Дирихлетийн далд хуваарилалтыг хэрхэн ашигладаг вэ?

Видео: Та Дирихлетийн далд хуваарилалтыг хэрхэн ашигладаг вэ?

Видео: Та Дирихлетийн далд хуваарилалтыг хэрхэн ашигладаг вэ?
Видео: (ML 7.7.A1) Дирихлетийн тархалт 2024, May
Anonim

LDA гэж юу вэ?

  1. Өөрийн өвөрмөц багц хэсгүүдийг сонго.
  2. Хэдэн нийлмэл материал авахыг хүсч байгаагаа сонгоно уу.
  3. Нэг нийлмэл материалд хэдэн хэсэг авахыг хүсч байгаагаа сонгоно уу (Пуассоны дээж хуваарилалт ).
  4. Та хэдэн сэдэв (категори) хүсч байгаагаа сонгоно уу.
  5. Тэг биш ба эерэг хязгаарын хоорондох тоог сонгоод альфа гэж нэрлэнэ үү.

Үүний нэгэн адил, та Latent Dirichlet Allocation машин сурч байна уу гэж асууж магадгүй юм.

Далд Дирихлетийн хуваарилалт ( LDA ) нь корпусын үүсгэгч магадлалын загвар юм. Үндсэн санаа нь баримт бичгүүдийг санамсаргүй холимог хэлбэрээр илэрхийлдэг далд Сэдэв бүр нь үг хэллэгээр хуваарилагдсан сэдвүүд юм.

Үүний нэгэн адил LDA сэдвийн загварчлал хэрхэн ажилладаг вэ? LDA Баримт бичгүүдийг сэдвүүдийн холимогоос бэлтгэсэн гэж үздэг. Дараа нь тэдгээр сэдвүүд нь магадлалын тархалтад тулгуурлан үг үүсгэдэг. Баримт бичгийн өгөгдлийн багцыг өгснөөр, LDA ухарч, ямар сэдвүүдийг олохыг хичээдэг болно эхний ээлжинд эдгээр баримт бичгүүдийг бий болгох. LDA нь матрицын хүчин зүйл ангилах арга юм.

Үүнтэй холбогдуулан далд Дирихлетийн хуваарилалтыг хэрхэн дууддаг вэ?

“Ч”-ийг “ш” авиа, хатуу “к” авиа шиг дуудаж болно. Мөн "et" гэсэн төгсгөлийг Францын загвараар "lay" эсвэл "let" гэж хатуу "t" авиагаар дуудаж болно. Далд Дирихлетийн хуваарилалт Анх 2003 оны судалгааны баримт бичигт тайлбарласан боловч ихэнх техникүүдийн нэгэн адил гол санааг өмнө нь нийтэлсэн.

Далд Дирихлетийн хуваарилалт хяналттай юу, хяналтгүй юу?

Энэ нь зөв LDA нь хяналтгүй арга. Гэсэн хэдий ч үүнийг сунгаж болно хяналт тавьдаг нэг.

Зөвлөмж болгож буй: