речь переводится в текст, далее элементарно - чистка незначащего, лемматизация, выделение групп LDA алгоритмом
аааа, вононочо... ну, да, такое надо "разворачивать" а то зритель (мы) не поймёт - что же хотели сказать в течение 30 минут те "самовлюблённые болваны"