Detecție rapidă și precisă a patruzeci de tipuri de fructe și legume: Set de date și metodă
Detectarea precisă a fructelor și legumelor reprezintă o sarcină cheie în automatizarea agricolă.
Cu toate acestea, metodele existente de detectare se concentrează de obicei pe identificarea unui singur tip de fruct sau legumă și nu sunt echipate pentru a face față mediilor complexe și diverse.
Pentru a aborda această problemă, introducem primul set de date de referință la scară largă pentru detectarea fructelor și legumelor — FV40.
Acest set de date conține 14.511 de imagini, acoperind 40 de categorii diferite de fructe și legume, cu peste 100.000 de casete de delimitare annotate.
În plus, propunem un cadru nou pentru detectarea fructelor și legumelor — FVRT-DETR.
Bazat pe arhitectura Transformer, acest cadru integrează un algoritm de detectare în timp real, end-to-end.
FVRT-DETR îmbunătățește extragerea caracteristicilor prin integrarea rețelei de bază Mamba și optimizează performanța de detectare pentru obiecte de dimensiuni variate prin proiectarea unui modul de codificator pentru fuziunea de caracteristici profunde multi-scalare (MDFF encoder).
Numeroasele experimente arată că FVRT-DETR performează excelent pe setul de date FV40.
În mod particular, demonstrează un avantaj semnificativ în detectarea obiectelor mici și în scenarii complexe.
Comparativ cu algoritmi de detectare de ultimă generație, precum YOLOv10, FVRT-DETR obține rezultate superioare pe mai multe metrici-cheie.
Cadrul FVRT-DETR și setul de date FV40 oferă o soluție eficientă și scalabilă pentru detectarea fructelor și legumelor, având o valoare academică semnificativă și un potențial aplicativ ridicat..
Publică comentariul