Entidad: Universitat Rovira i Virgili (URV)
Confidencialidad: No
Enseñanza(s): Enginyeria de la Seguretat Informàtica i Intel·ligència Artificial
Título en diferentes idiomas: Intelligent Assistant System Based on Single Camera and Deep Neural Networks for Aiding Visual Impaired Individuals
Resumen: Els mètodes de detecció d'objectes i estimació de profunditat poden ajudar els individus amb discapacitat visual a entendre l'escena davant d'ells. Hi ha múltiples aplicacions que proporcionen ajuda a aquests individus connectant-los (per una videotrucada) a altres que poden ajudar-los a descriure l'escena. No obstant això, creiem que puc donar una alternativa a aquestes aplicacions utilitzant models d'aprenentatge automàtic ràpid i lluminós i evitar la interacció del suport humà. El projecte es divideix en dues parts. La primera part és la detecció d'objectes en una escena. Utilitzem el model YOLOV5S que es va formar en el conjunt de dates del COCO amb 80 objectes diferents. La segona part del model d'estimació de profunditat. Vam utilitzar Midas de pytorch després de provar diversos models de profunditat. El model d'estimació de profunditat m'ajudarà a estimar la distància de cada objecte extret del model de profunditat. L'objectiu final és prendre una imatge o un vídeo de l'usuari i extreure els objectes amb la distància de cadascun d'ells i enviar aquestes dades a l'usuari en un format de nota de so.
Materia: Enginyeria informàtica
Curso académico: 2020-2021
Idioma: en
Fecha de la defensa del trabajo: 2021-09-10
Áreas temàticas: Ingeniería informática
Estudiante: Farouk Marei, David George
Departamento: Enginyeria Informàtica i Matemàtiques
Fecha de alta en el repositorio: 2022-03-17
Título en la lengua original: Intelligent Assistant System Based on Single Camera and Deep Neural Networks for Aiding Visual Impaired Individuals
Derechos de Accesso: info:eu-repo/semantics/openAccess
Director del proyecto: Rashwan, Hatem A.; Puig, Dominque