Generalized Concept Overlay for Semantic Multi-Modal Analysis of Audio-visual Content

Vasileios Mezaris; Spyros Gidaros; Ioannis Kompatsiaris

doi:10.1109/SMAP.2009.13

Semantic Media Adaptation and Personalization, International Workshop on

Generalized Concept Overlay for Semantic Multi-Modal Analysis of Audio-visual Content

Year: 2009, Pages: 27-32

DOI Bookmark: 10.1109/SMAP.2009.13

Authors

Vasileios Mezaris
Spyros Gidaros
Ioannis Kompatsiaris

Abstract

In this work, the problem of performing multi-modal analysis of audio-visual streams by effectively combining the results of multiple uni-modal analysis techniques is addressed. A non-learning-based approach is proposed to this end, that takes into account the potential variability of the different uni-modal analysis techniques in terms of the decomposition of the audio-visual stream that they adopt, the concepts of an ontology that they consider, the varying semantic importance of each modality, and other factors. Preliminary results from the application of the proposed approach to broadcast News content reveal its effectiveness.

Like what you’re reading?

Already a member?

Get this article FREE with a new membership!

A Framework of Multi-modal Corpus for Mandarin Learning
2009 IITA International Conference on Control, Automation and Systems Engineering, CASE 2009
CATCH-2004 Multi-Modal Browser: Overview Description with Usability Analysis
Proceedings Fourth IEEE International Conference on Multimodal Interfaces
Example-based cross-modal denoising
2012 IEEE Conference on Computer Vision and Pattern Recognition
Crossmodal Matching of Speakers Using Lip and Voice Features in Temporally Non-overlapping Audio and Video Streams
Pattern Recognition, International Conference on
Audio-Visual Event Localization based on Cross-Modal Interacting Guidance
2021 IEEE Fourth International Conference on Artificial Intelligence and Knowledge Engineering (AIKE)
Wnet: Audio-Guided Video Object Segmentation via Wavelet-Based Cross- Modal Denoising Networks
2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
Collecting Cross-Modal Presence-Absence Evidence for Weakly-Supervised Audio- Visual Event Perception
2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal Targets
2023 IEEE/CVF International Conference on Computer Vision (ICCV)
AVGZSLNet: Audio-Visual Generalized Zero-Shot Learning by Reconstructing Label Features from Multi-Modal Embeddings
2021 IEEE Winter Conference on Applications of Computer Vision (WACV)
Audio-Visual Instance Discrimination with Cross-Modal Agreement
2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

Generalized Concept Overlay for Semantic Multi-Modal Analysis of Audio-visual Content

Authors

Abstract

Related Articles