Publications
2017
1.
Rubio-Fernández, Pablo; Fidalgo, Eduardo; Alegre, Enrique; González-Castro, Víctor
Evaluación de métodos para realizar resúmenes automáticos de vídeos Artículo de revista
En: Actas de las XXXVIII Jornadas de Automática, 2017, (Publisher: Servicio de Publicaciones de la Universidad de Oviedo).
Resumen | Enlaces | BibTeX | Etiquetas: Aprendizaje Profundo, CUS, Fotograma clave, Python, Red Neuronal Convolucional, Resumen de Vídeo
@article{rubio-fernandez_evaluacion_2017,
title = {Evaluación de métodos para realizar resúmenes automáticos de vídeos},
author = {Pablo Rubio-Fernández and Eduardo Fidalgo and Enrique Alegre and Víctor González-Castro},
url = {https://digibuo.uniovi.es/dspace/bitstream/handle/10651/46952/ActasJA2017Rubio.pdf?sequence=1},
year = {2017},
date = {2017-01-01},
journal = {Actas de las XXXVIII Jornadas de Automática},
abstract = {Este trabajo evalúa tres métodos automáticos de resumen de videos: Video2GIF, basado en redes neuronales convolucionales, Move Detector, que selecciona fotogramas con movimiento, y Peaks Volume, que analiza el espectro de audio. Video2GIF y Peaks Volume fueron evaluados con el dataset VSUMM, mientras que Move Detector se probó con VIRAT. Se utilizaron métricas CUS para comparar los resúmenes con los originales. Los resultados indican que Video2GIF es más efectivo en videos con acciones humanas breves, mientras que Peaks Volume destaca en documentales y logra reducir la duración del video a la mitad con una calidad aceptable (>0.4 sobre 1 en CUS).},
note = {Publisher: Servicio de Publicaciones de la Universidad de Oviedo},
keywords = {Aprendizaje Profundo, CUS, Fotograma clave, Python, Red Neuronal Convolucional, Resumen de Vídeo},
pubstate = {published},
tppubtype = {article}
}
Este trabajo evalúa tres métodos automáticos de resumen de videos: Video2GIF, basado en redes neuronales convolucionales, Move Detector, que selecciona fotogramas con movimiento, y Peaks Volume, que analiza el espectro de audio. Video2GIF y Peaks Volume fueron evaluados con el dataset VSUMM, mientras que Move Detector se probó con VIRAT. Se utilizaron métricas CUS para comparar los resúmenes con los originales. Los resultados indican que Video2GIF es más efectivo en videos con acciones humanas breves, mientras que Peaks Volume destaca en documentales y logra reducir la duración del video a la mitad con una calidad aceptable (>0.4 sobre 1 en CUS).