Treballs Fi de MàsterEnginyeria Informàtica i Matemàtiques

Reconeixement de fruita automatitzat mitjançant tècniques d'aprenentatge profund

  • Dades identificatives

    Identificador:  TFM:2337
    Autors:  Abderrahmane, Hammia
    Resum:
    Aquesta tesi presenta un estudi exhaustiu sobre el reconeixement automatitzat d'objectes utilitzant enfocaments d'aprenentatge profund, amb el reconeixement de fruites com a estudi de cas representatiu per demostrar l'aplicabilitat més àmplia de les metodologies de visió per computador. La investigació aborda els reptes fonamentals en el desenvolupament de sistemes robusts de reconeixement visual mitjançant la implementació i l'anàlisi comparativa de dos paradigmes diferents d'aprenentatge profund: l'aprenentatge per transferència amb ResNet50 per a tasques de classificació i YOLOv11 per a la detecció d'objectes en temps real. La metodologia abasta escenaris controlats i del món real per avaluar el rendiment del model en diferents condicions ambientals. Utilitzant el conjunt de dades Fruits- 360 que conté 201 categories amb fons controlats, el model ResNet50 aconseguit una precisió excepcional del 98,62% mitjançant tècniques d'aprenentatge per transferència. En paral·lel, la implementació de YOLOv11, entrenada en un conjunt de dades del món real de 32 classes amb fons naturals, va demostrar unes capacitats de detecció robustes amb un 93,2% de mAP@0.5 i processament en temps real a 53,5 FPS. Una contribució crítica d'aquesta investigació és l'anàlisi sistemàtica de la bretxa de domini entre les condicions de laboratori controlades i els escenaris de desplegament del món real. Les troballes revelen que, si bé els models de classificació excel·leixen en conjunts de dades estandarditzats, el seu rendiment pot degradar-se significativament quan s'apliquen a entorns naturals, mentre que els models de detecció entrenats en diverses dades del món real garanteixen una aplicabilitat pràctica més àmplia. Per demostrar la integració d'ambdós enfocaments, es va desenvolupar una interfície gràfica unificada, que mostra com es poden combinar tècniques complementàries d'aprenentatge profund per a sistemes de reconeixement visual integrals. Si bé aquest treball es centra específicament en aplicacions d'automatització agrícola com ara sistemes de classificació, control de qualitat i collita robòtica, el marc metodològic i l'anàlisi comparativa proporcionen informació valuosa per a qualsevol aplicació de visió per computador que requereixi un reconeixement robust d'objectes en diferents condicions ambientals. La investigació contribueix al camp més ampli del reconeixement visual automatitzat establir les millors pràctiques per a la selecció de models, les estratègies d'entrenament i les consideracions de desplegament en escenaris del món real.
  • Altres:

    Entitat: Universitat Rovira i Virgili (URV)
    Confidencialitat: No
    Ensenyament(s): Enginyeria de la Seguretat Informàtica i Intel·ligència Artificial
    Aprenentatge Servei: No
    Matèria: Visió artificial (Robòtica)
    Curs acadèmic: 2024-2025
    Data de la defensa del treball: 2025-06-12
    Estudiant: Abderrahmane, Hammia
    Departament: Enginyeria Informàtica i Matemàtiques
    Data d'alta al repositori: 2026-03-13
    Crèdits del TFM: 9
    Drets d'accés: info:eu-repo/semantics/openAccess
    Director del projecte: Isern Alarcón, David
  • Paraules clau:

    Visió per computador
    Aprenentatge profund
    Reconeixement d'objectes
    ResNet50
    YOLOv11
    Aprenentatge per transferència
    Detecció d'objectes
    Adaptació de dominis
    Automatització agrícola
    Enginyeria informàtica
  • Documents:

  • Cerca a google

    Search to google scholar