Determinarea caracteristicilor optime ale setului de date pentru îmbunătățirea performanței YOLO în detectarea obiectelor agricole

Progresele recente în inteligența artificială și viziunea computerizată au condus la avansuri semnificative în utilizarea tehnologiilor agricole pentru predicția producției, detectarea dăunătorilor și monitorizarea în timp real a condițiilor plantelor.

Cu toate acestea, colectarea de seturi de date de imagini de înaltă calitate și la scară largă în sectorul agricol rămâne o provocare, în special pentru seturile de date specializate, cum ar fi cele cu imagini ale bolilor plantelor.

Acest studiu a analizat efectele mărimii imaginilor (320–640+ pixels) și numărului de etichete asupra performanței unui model de detectare a obiectelor bazat pe YOLO, utilizând diverse seturi de date agricole pentru căpșuni, roșii, ardei iuți și ardei grași.

Performanța modelului a fost evaluată folosind lucrarea intersectării peste uniune (IoU) și precizia medie (AP), curba AP fiind netezită folosind filtrul Savitzky–Golay și metoda EEM.

Rezultatele au arătat că creșterea numărului de etichete a îmbunătățit performanța modelului până la un anumit punct, după care performanța a început să scadă treptat.

În plus, extinderea dimensiunii imaginilor de la 320 la 640 pixels a crescut semnificativ performanța modelului, însă creșterile ulterioare peste 640 au condus doar la îmbunătățiri marginale.

Cu toate acestea, timpul de antrenare și utilizarea unității de procesare grafică (GPU) au crescut liniar odată cu mărirea dimensiunii imaginilor, deoarece imaginile de dimensiuni mai mari necesită resurse computaționale mai mari.

Aceste descoperiri subliniază importanța unei strategii optime pentru alegerea mărimii imaginilor și a numărului de etichete, ținând cont de constrângerile de resurse în dezvoltarea de modele pentru aplicații reale..