Determinarea caracteristicilor optime ale setului de date pentru îmbunătățirea performanței YOLO în detectarea obiectelor agricole
Progresele recente în domeniul inteligenței artificiale și viziunii computerizate au condus la avansuri semnificative în utilizarea tehnologiilor agricole pentru predicția recoltei, detectarea dăunătorilor și monitorizarea în timp real a condițiilor plantelor.
Totuși, colectarea de seturi de date de imagini de înaltă calitate, la scară largă, în sectorul agricol rămâne o provocare, în special pentru seturile de date specializate, precum cele cu imagini ale bolilor plantelor.
Acest studiu a analizat efectele dimensiunii imaginii (de la 320 la peste 640) și ale numărului de etichete asupra performanței unui model de detecție a obiectelor bazat pe YOLO, utilizând diverse seturi de date agricole pentru căpșuni, roșii, ardei iuți și ardei grași.
Performanța modelului a fost evaluată folosind indicele de intersecție peste uniune (IoU) și precizia medie (AP), unde curba AP a fost netezită cu filtrul Savitzky–Golay și metoda EEM.
Rezultatele au arătat că majorarea numărului de etichete a îmbunătățit performanța modelului până la un anumit punct, după care aceasta a început să scadă treptat.
În plus, creșterea dimensiunii imaginii de la 320 la 640 a dus la o îmbunătățire semnificativă a performanței modelului, însă creșterile suplimentare dincolo de 640 au oferit doar îmbunătățiri marginale.
Cu toate acestea, timpul de antrenament și utilizarea unității de procesare grafică (GPU) au crescut proporțional cu creșterea dimensiunii imaginilor, deoarece imaginile mai mari necesită resurse computaționale mai mari.
Aceste descoperiri subliniază importanța strategiei optime pentru alegerea dimensiunii imaginilor și numărului de etichete, în condițiile restricțiilor de resurse, în dezvoltarea modelelor în aplicații reale..
Publică comentariul