Reconeixement de fruita automatitzat mitjançant tècniques d'aprenentatge profund

Abderrahmane, Hammia

Dades identificatives

Identificador: TFM:2337

Handle: https://hdl.handle.net/20.500.11797/TFM2337

Autors: Abderrahmane, Hammia

Resum:
Aquesta tesi presenta un estudi exhaustiu sobre el reconeixement automatitzat d'objectes utilitzant enfocaments d'aprenentatge profund, amb el reconeixement de fruites com a estudi de cas representatiu per demostrar l'aplicabilitat més àmplia de les metodologies de visió per computador. La investigació aborda els reptes fonamentals en el desenvolupament de sistemes robusts de reconeixement visual mitjançant la implementació i l'anàlisi comparativa de dos paradigmes diferents d'aprenentatge profund: l'aprenentatge per transferència amb ResNet50 per a tasques de classificació i YOLOv11 per a la detecció d'objectes en temps real. La metodologia abasta escenaris controlats i del món real per avaluar el rendiment del model en diferents condicions ambientals. Utilitzant el conjunt de dades Fruits- 360 que conté 201 categories amb fons controlats, el model ResNet50 aconseguit una precisió excepcional del 98,62% mitjançant tècniques d'aprenentatge per transferència. En paral·lel, la implementació de YOLOv11, entrenada en un conjunt de dades del món real de 32 classes amb fons naturals, va demostrar unes capacitats de detecció robustes amb un 93,2% de mAP@0.5 i processament en temps real a 53,5 FPS. Una contribució crítica d'aquesta investigació és l'anàlisi sistemàtica de la bretxa de domini entre les condicions de laboratori controlades i els escenaris de desplegament del món real. Les troballes revelen que, si bé els models de classificació excel·leixen en conjunts de dades estandarditzats, el seu rendiment pot degradar-se significativament quan s'apliquen a entorns naturals, mentre que els models de detecció entrenats en diverses dades del món real garanteixen una aplicabilitat pràctica més àmplia. Per demostrar la integració d'ambdós enfocaments, es va desenvolupar una interfície gràfica unificada, que mostra com es poden combinar tècniques complementàries d'aprenentatge profund per a sistemes de reconeixement visual integrals. Si bé aquest treball es centra específicament en aplicacions d'automatització agrícola com ara sistemes de classificació, control de qualitat i collita robòtica, el marc metodològic i l'anàlisi comparativa proporcionen informació valuosa per a qualsevol aplicació de visió per computador que requereixi un reconeixement robust d'objectes en diferents condicions ambientals. La investigació contribueix al camp més ampli del reconeixement visual automatitzat establir les millors pràctiques per a la selecció de models, les estratègies d'entrenament i les consideracions de desplegament en escenaris del món real.
Altres:

Entitat: Universitat Rovira i Virgili (URV)
Confidencialitat: No
Ensenyament(s): Enginyeria de la Seguretat Informàtica i Intel·ligència Artificial
Aprenentatge Servei: No
Matèria: Visió artificial (Robòtica)
Curs acadèmic: 2024-2025
Data de la defensa del treball: 2025-06-12
Estudiant: Abderrahmane, Hammia
Departament: Enginyeria Informàtica i Matemàtiques
Data d'alta al repositori: 2026-03-13
Crèdits del TFM: 9
Drets d'accés: info:eu-repo/semantics/openAccess
Director del projecte: Isern Alarcón, David

Paraules clau:

Visió per computador
Aprenentatge profund
Reconeixement d'objectes
ResNet50
YOLOv11
Aprenentatge per transferència
Detecció d'objectes
Adaptació de dominis
Automatització agrícola
Enginyeria informàtica
Documents:

Memòria
Cerca a google

Reconeixement de fruita automatitzat mitjançant tècniques d'aprenentatge profund

Dades identificatives

Altres:

Paraules clau:

Documents:

Cerca a google