Αναζήτηση βίντεο με αναγνώριση φωνής

Στο διαδίκτυο κυκλοφορούν πολλά αρχεία με βιντεοσκοπημένες συζητήσεις, διαλέξεις και μαθήματα. Εξαιρετικό περιεχόμενο είναι συχνά διαθέσιμο μερικά μόνον κλικ μακριά μας. Και δεν είναι μόνον υλικό που, με τον έναν ή τον άλλο τρόπο, έχει υποκλαπεί αλλά και υλικό που διαθέτουν Πανεπιστήμια, εκπαιδευτικοί οργανισμοί αλλά και οι ίδιοι οι επιστήμονες που κοινοποιούν μ’ αυτό τον τρόπο τη δουλειά τους.

Το βασικό μειονέκτημα της αναζήτησης σε βιβλιοθήκες που περιέχουν αρχεία βίντεο είναι ότι γίνεται είτε με το όνομα του αρχείου είτε με τα μεταδεδομένα που προσθέτει ο δημιουργός του. Το πρόβλημα είναι όμως, ότι αυτά τα κριτήρια εύρεσης δεν αντιστοιχούν πάντα ή απολύτως με το περιεχόμενο. Μου έχει συμβεί να έχω βρει βίντεο διάλεξης διάρκειας περίπου μιας ώρας, να έχω ιδροκοπήσει προσπαθώντας να καταλάβω τι λέει ένας προφέσορας με προφορά του αμερικάνικου νότου για να ανακαλύψω στο τέλος ότι αυτό που με ενδιέφερε (και αναφερόταν στα μεταδεδομένα του αρχείου) ήταν μια ασήμαντη αναφορά διάρκειας λίγων μόνο δευτερολέπτων.

Απάντηση στο πρόβλημα δίνει η Google που χρησιμοποιεί τεχνολογία αναγνώρισης φωνής (voice recognition ή speech to text) ώστε να καταγράψει το κείμενο του κάθε βίντεο, δημιουργώντας έτσι τον κατάλογο λέξεων που διευκολύνουν την «φωνητική» αναζήτηση. Μ’ άλλα λόγια κάθε βίντεο “απομαγνητοφωνείται” ώστε να διευκολυνθεί η διαδικασία αναζήτησης. Διάβαστε περισσότερα “Αναζήτηση βίντεο με αναγνώριση φωνής”