Lstm параметрийн тоог хэрхэн тооцдог вэ?
Lstm параметрийн тоог хэрхэн тооцдог вэ?

Видео: Lstm параметрийн тоог хэрхэн тооцдог вэ?

Видео: Lstm параметрийн тоог хэрхэн тооцдог вэ?
Видео: LSTM - долгая краткосрочная память | #23 нейросети на Python 2024, May
Anonim

Тиймээс таны үнэт зүйлсийн дагуу. Үүнийг томъёонд оруулбал:->(n=256, m=4096), нийт параметрийн тоо байна 4*((256*256) + (256*4096) + (256)) = 4*(1114368) = 4457472. The тоо жингийн байна 28 = 16 (тоо_нэгж * тоо_нэгж) давтагдах холболтод + 12 (оролтын_цэг * тоо_нэгж) оролтод.

Мөн параметрийн тоог хэрхэн олох вэ?

руу тооцоолох сурах боломжтой параметрүүд Энд бидний хийх ёстой зүйл бол зөвхөн m өргөн, n өндөр, n-ийн хэлбэрийг үржүүлж, k шүүлтүүрийг тооцох явдал юм. Шүүлтүүр бүрийн хувьд хэвийсэн нэр томъёог бүү мартаарай. Параметрийн тоо CONV давхаргад: ((m * n)+1)*k), шүүлтүүр бүрийн хэвийсэн нэр томъёоны улмаас 1-ийг нэмсэн.

Үүний нэгэн адил, Lstm хэдэн далд нэгжтэй вэ? Ан LSTM сүлжээ. Сүлжээ нь таван оролттой нэгж , a далд давхарга хоёроос бүрдэнэ LSTM санах ойн блок ба гурван гаралт нэгж . Санах ойн блок бүр дөрвөн оролттой боловч зөвхөн нэг гаралттай.

Дараа нь та RNN дахь параметрийн тоог хэрхэн олох вэ гэж асууж магадгүй юм.

1 Хариулт. W, U, V нэгжүүд нь бүх алхмуудаар хуваалцагдана RNN мөн эдгээр нь цорын ганц юм параметрүүд зурагт тайлбарласан загварт. Тиймээс параметрийн тоо Сургалтын явцад суралцах ёстой = бүдэг(W)+dim(V)+dim(U). Асуултанд байгаа өгөгдөл дээр үндэслэн энэ = n2+kn+nm.

Lstm хэдэн давхаргатай вэ?

Ерөнхийдөө 2 давхаргууд илүү төвөгтэй шинж чанаруудыг илрүүлэхэд хангалттай болохыг харуулсан. Илүү давхаргууд илүү сайн боловч сургахад хэцүү байж болно. Ерөнхий дүрмээр - 1 далд давхарга Энэ мэт энгийн бодлоготой ажиллах ба хоёр нь боломжийн төвөгтэй функцуудыг олоход хангалттай.

Зөвлөмж болгож буй: